본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] math 9.1 확률분포의 추정

by manga0713 2021. 5. 5.

[ 이미지 출처 : 위키백과 - 확률분포 ]

 

● 확률분포의 결정

 

확률분포를 알아내는 일은 다음처럼 두 작업으로 나뉜다.

  1. 확률변수가 우리가 배운 베르누이분포, 이항분포, 정규분포 등의 기본 분포 중 어떤 확률분포를 따르는지 알아낸다.
  2. 데이터로부터 해당 확률분포의 모수의 값을 구한다.

첫 번째 작업 즉, 확률변수가 어떤 확률분포를 따르는가는 데이터가 생성되는 원리를 알거나 데이터의 특성을 알면 추측할 수 있다. 히스토그램을 그려서 확률분포의 모양을 살펴보고 힌트를 얻을 수도 있다.

이 규칙에는 예외가 있을 수 있다. 예를 들어 항상 양수인 데이터인 경우에도 정규분포로 모형화가 가능하다면 정규분포를 사용할 수 있다.

 

 

● 모수 추정 방법론

 

두번째 작업 즉, "모수의 값으로 가장 가능성이 높은 하나의 숫자를 찾아내는 작업을 모수 추정(parameter estimation)"이라고 한다. 모수 추정 방법에는 다음과 같은 방법들이 있다.

 

  • 모멘트 방법
  • 최대가능도 추정법
  • 베이즈 추정법

 

 

dss_math9_1_estimation probability distribution 확률분포 추정.ipynb
0.05MB

 

- 출처 : [데이터 사이언스 스쿨] math 9.1 확률분포의 추정