본문 바로가기

IT 와 Social 이야기/Python348

[데이터 사이언스 스쿨] math 9.3 베이즈 추정법 ● 베이즈 추정법(bayesian estimation) : 모숫값이 가질 수 있는 모든 가능성의 분포를 계산하는 작업 베이즈 추정법을 사용하는 이유는 추정된 모숫값 숫자 하나만으로는 추정의 신뢰도와 신뢰구간을 구할 수 없기 때문 베이즈 추정법의 장점은 순차적(sequential) 계산이 가능하다는 점이다. 예를 들어 매 50개의 데이터를 수집하는 경우를 생각하자. 베이즈 추정법법을 사용하면 첫날 50개의 데이터로 모수를 추정한 뒤 다음날에는 추가적인 데이터 50개를 사용하여 모숫값을 더 정확하게 수정할 수 있다. - 출처 : [데이터 사이언스 스쿨] math 9.3 베이즈 추정법 2021. 5. 5.
[데이터 사이언스 스쿨] math 9.2 최대가능도 추정법 ● 가능도함수(likeligood function) : 확률밀도함수에서 모수를 변수로 보는 경우에 이 함수를 가능도함수(likelihood function)라고 한다. 가능도함수를 수식으로 나타내면 수식 자체는 확률밀도함수의 수식과 같다. 하지만 가능도함수는 확률분포함수가 아니라는 점에 주의해야 한다. 확률밀도함수는 가능한 모든 표본값 x에 대해 적분하면 전체 면적이 1이 되지만, 가능도함수는 가능한 모든 모숫값 θ에 대해 적분했을 때 1이 된다는 보장이 없다. ● 최대가능도추정법(Maximum Likelihood Estimation, MLE) : 주어진 표본에 대해 가능도를 가장 크게 하는 모수 θ를 찾는 방법 위 그래프 범례에 나온 값을 바탕으로 가장 큰 가능도를 가진 확률분포를 선택해야 한다. - .. 2021. 5. 5.
[데이터 사이언스 스쿨] math 9.1 확률분포의 추정 ● 확률분포의 결정 확률분포를 알아내는 일은 다음처럼 두 작업으로 나뉜다. 확률변수가 우리가 배운 베르누이분포, 이항분포, 정규분포 등의 기본 분포 중 어떤 확률분포를 따르는지 알아낸다. 데이터로부터 해당 확률분포의 모수의 값을 구한다. 첫 번째 작업 즉, 확률변수가 어떤 확률분포를 따르는가는 데이터가 생성되는 원리를 알거나 데이터의 특성을 알면 추측할 수 있다. 히스토그램을 그려서 확률분포의 모양을 살펴보고 힌트를 얻을 수도 있다. 데이터는 0 또는 1 뿐이다. → 베르누이분포 데이터는 카테고리 값이어야 한다. → 카테고리분포 데이터는 0과 1 사이의 실수 값이어야 한다. → 베타분포 데이터는 항상 0 또는 양수이어야 한다. → 로그정규분포, 감마분포, F분포, 카이제곱분포, 지수분포, 하프코시분포 등.. 2021. 5. 5.
[데이터 사이언스 스쿨] math 8.7 베타분포, 감마분포, 디리클레분포 베타분포, 감마분포, 디리클레분포는 모숫값을 조정하여 분포의 모양을 우리가 원하는대로 쉽게 바꿀 수 있다. 모숫값은 분포 모양을 조절하는 조절값이라고 생각하면 된다. 이러한 특성때문에 이 분포들은 데이터가 이루는 분포를 표현하기보다는 베이지안 확률론의 관점에서 어떤 값에 대해 우리가 가지고 있는 확신 혹은 신뢰의 정도를 표현하는데 주로 사용된다. ● 디리클레분포(dirichlet distribution) 베타분포의 확장판이라고 할 수 있다. 베타분포는 0과 1사이의 값을 가지는 단일(univariate) 확률변수의 베이지안 모형에 사용되고 디리클레분포는 0과 1사이의 값을 가지는 다변수(multivariate) 확률변수의 베이지안 모형에 사용된다. - 출처 : [데이터 사이언스 스쿨] math 8.7 베.. 2021. 5. 4.