본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] math 8.3 카테고리분포와 다항분포

by manga0713 2021. 5. 4.

● 카테고리 확률변수(Categorical  random variable)는 1부터 K까지 K개 정숫값 중 하나가 나온다. 이 정숫값을 범주값, 카테고리(category) 혹은 클래스(class)라고 한다. 주사위를 던져 나오는 눈금 수는 K=6인 카테고리분포다.

 

주의할 점은 원래 카테고리는 스칼라값이지만 카테고리 확률변수는 1과 0으로만 이루어진 다차원 벡터를 출력한다. 숫자를 이렇게 변형하는 것을 원핫인코딩(One-Hot-Encoding)이라고 한다.

 

 

 

● 다중 분류문제(multi-class classification)

 

 

dss_math8_3_scipy_category 카테고리분포.ipynb
0.11MB

 

- 출처 : [데이터 사이언스 스쿨] math 8.3 카테고리분포와 다항분포