확률분포를 알아내는 일은 다음처럼 두 작업으로 나뉜다.
- 데이터는 0 또는 1 뿐이다. → 베르누이분포
- 데이터는 카테고리 값이어야 한다. → 카테고리분포
- 데이터는 0과 1 사이의 실수 값이어야 한다. → 베타분포
- 데이터는 항상 0 또는 양수이어야 한다. → 로그정규분포, 감마분포, F분포, 카이제곱분포, 지수분포, 하프코시분포 등
- 데이터가 크기 제한이 없는 실수다. → 정규분포 또는 스튜던트 t분포, 코시분포, 라플라스분포 등
이 규칙에는 예외가 있을 수 있다. 예를 들어 항상 양수인 데이터인 경우에도 정규분포로 모형화가 가능하다면 정규분포를 사용할 수 있다.
● 모수 추정 방법론
두번째 작업 즉, "모수의 값으로 가장 가능성이 높은 하나의 숫자를 찾아내는 작업을 모수 추정(parameter estimation)"이라고 한다. 모수 추정 방법에는 다음과 같은 방법들이 있다.
- 모멘트 방법
- 최대가능도 추정법
- 베이즈 추정법
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] math 9.3 베이즈 추정법 (0) | 2021.05.05 |
---|---|
[데이터 사이언스 스쿨] math 9.2 최대가능도 추정법 (0) | 2021.05.05 |
[데이터 사이언스 스쿨] math 8.7 베타분포, 감마분포, 디리클레분포 (0) | 2021.05.04 |
[데이터 사이언스 스쿨] math 8.6 다변수정규분포 (0) | 2021.05.04 |
[데이터 사이언스 스쿨] math 8.5 스튜던트 t분포, 카이제곱분포, F분포 (0) | 2021.05.04 |