● 확률 : 사건(event)이라는 표본의 집합에 대해 숫자를 할당하는 함수
● 확률분포(probability distribution) : 어떤 사건에 어느 정도의 확률이 할당되었는지 묘사한 정보
● 단순사건(elementary event, atomic event) : 표본이 하나인 사건
● 확률질량함수(probability mass function) : 단순사건에 대한 확률만 정의하는 함수
● 구간(interval) : 표본공간이 실수의 집합이라면 대부분의 사건(부분집합)은 시작점과 끝점이라는 두 숫자로 이루어진 구간(interval)으로 표현된다.
● 누적분포함수(cumulative distribution function) : 숫자 하나만으로 사건 즉, 구간을 정의하기 위하여 시작점을 모두 똑같이 음의 무한대(−∞)로 구간으로하여 사건의 확률분포를 묘사하는 함수
● 확률밀도함수(probability density function) : 누적분포함수를 미분하여 구한 도함수
기울기를 구하는 수학적 연산이 미분(differentiation)이므로 누적분포함수를 미분하여 누적분포함수의 기울기를 출력하는 함수를 만들면 어떤 x1값 근처의 확률이 다른 x2값 근처보다 더 확률이 높은지 또는 낮은지 쉽게 파악할 수 있다.
확률밀도함수는 특정한 구간의 확률이 다른 구간에 비해 상대적으로 얼마나 높은가를 나타내는 것이며 그 값 자체가 확률은 아니다라는 점을 명심해야 한다.
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] math 6.6 베이즈 정리 (0) | 2021.05.03 |
---|---|
[데이터 사이언스 스쿨] math 6.5 결합확률과 조건부확률 (0) | 2021.05.03 |
[데이터 사이언스 스쿨] math 6.3 확률의 성질 (0) | 2021.05.03 |
[데이터 사이언스 스쿨] math 6.2 확률의 수학적 정의와 의미 (0) | 2021.05.03 |
[데이터 사이언스 스쿨] math 6.1 집합 (0) | 2021.05.03 |