본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] math 6.4 확률분포함수

by manga0713 2021. 5. 3.

[ 이미지 출처 : EXCELSIOR ]

 

 

● 확률 : 사건(event)이라는 표본의 집합에 대해 숫자를 할당하는 함수

 

● 확률분포(probability distribution) : 어떤 사건에 어느 정도의 확률이 할당되었는지 묘사한 정보

 

● 단순사건(elementary event, atomic event) : 표본이 하나인 사건

 

● 확률질량함수(probability mass function) : 단순사건에 대한 확률만 정의하는 함수

 

 

 

● 구간(interval) : 표본공간이 실수의 집합이라면 대부분의 사건(부분집합)은 시작점과 끝점이라는 두 숫자로 이루어진 구간(interval)으로 표현된다.

 

● 누적분포함수(cumulative distribution function) : 숫자 하나만으로 사건 즉, 구간을 정의하기 위하여 시작점을 모두 똑같이 음의 무한대()로 구간으로하여 사건의 확률분포를 묘사하는 함수

 

 

 

● 확률밀도함수(probability density function) : 누적분포함수를 미분하여 구한 도함수

 

기울기를 구하는 수학적 연산이 미분(differentiation)이므로 누적분포함수를 미분하여 누적분포함수의 기울기를 출력하는 함수를 만들면 어떤 x1값 근처의 확률이 다른 x2값 근처보다 더 확률이 높은지 또는 낮은지 쉽게 파악할 수 있다.

 

확률밀도함수는 특정한 구간의 확률이 다른 구간에 비해 상대적으로 얼마나 높은가를 나타내는 것이며 그 값 자체가 확률은 아니다라는 점을 명심해야 한다.

 

 

 

 

dss_math6_4_probability distribution 확률 분포.ipynb
0.04MB

 

 

- 출처 : [데이터 사이언스 스쿨] math 6.4 확률분포함수