● 엔트로피(Entropy) : 확률분포가 가지는 정보의 확신도 혹은 정보량을 수치로 표현한 것
- 확률분포에서 특정한 값이 나올 확률이 높아지고 나머지 값의 확률은 낮아진다면 엔트로피가 작아진다. 반대로 여러가지 값이 나올 확률이 대부분 비슷한 경우에는 엔트로피가 높아진다.
- 확률 또는 확률밀도가 특정값에 몰려있으면 엔트로피가 작다고 하고 반대로 여러가지 값에 골고루 퍼져 있다면 엔트로피가 크다고 한다.
● 지니불순도(Gini impurity) : 엔트로피처럼 확률분포가 어느쪽에 치우쳐있는가를 재는 척도지만 로그를 사용하지 않으므로 계산량이 더 적어 엔트로피 대용으로 많이 사용된다.
- 출처 : [데이터 사이언스 스쿨] math 10.1 엔트로피
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] math 10.3 교차엔트로피와 쿨백-라이블러 발산 (0) | 2021.05.05 |
---|---|
[데이터 사이언스 스쿨] math 10.2 조건부 엔트로피 (0) | 2021.05.05 |
[데이터 사이언스 스쿨] math 9.5 사이파이를 사용한 검정 (0) | 2021.05.05 |
[데이터 사이언스 스쿨] math 9.4 검정과 유의확률 (0) | 2021.05.05 |
[데이터 사이언스 스쿨] math 9.3 베이즈 추정법 (0) | 2021.05.05 |