본문 바로가기

분포10

[데이터 사이언스 스쿨] math 9.4 검정과 유의확률 ● 검정(testing) : 데이터 뒤에 숨어있는 확률변수의 분포에 대한 가설이 맞는지 틀리는지 정량적으로 증명하는 작업 ● 가설(hypothesis) : 확률분포에 대한 어떤 주장 ● 귀무가설(null hypothesis) : 확률분포의 모수에 대한 가설 귀무가설은 확률분포를 특정한 상태로 고정시켜야 하므로 반드시 등식(equality)으로 표현되어야 한다. ● 가설과 검정 : 데이터를 특정한 확률분포를 가진 확률변수로 모형화하면 모수를 추정할 수 있다. 다음 작업으로는 데이터 뒤에 숨어있는 확률변수가 정말로 그 모숫값을 가졌는지 검증해보아야 한다. 다른 말로 하면 해당 확률변수가 그 모숫값을 가졌다는 주장을 논리적으로 증명해야 한다. ● 대립가설(altenative hypothesis, 연구가설 re.. 2021. 5. 5.
[데이터 사이언스 스쿨] math 8.7 베타분포, 감마분포, 디리클레분포 베타분포, 감마분포, 디리클레분포는 모숫값을 조정하여 분포의 모양을 우리가 원하는대로 쉽게 바꿀 수 있다. 모숫값은 분포 모양을 조절하는 조절값이라고 생각하면 된다. 이러한 특성때문에 이 분포들은 데이터가 이루는 분포를 표현하기보다는 베이지안 확률론의 관점에서 어떤 값에 대해 우리가 가지고 있는 확신 혹은 신뢰의 정도를 표현하는데 주로 사용된다. ● 디리클레분포(dirichlet distribution) 베타분포의 확장판이라고 할 수 있다. 베타분포는 0과 1사이의 값을 가지는 단일(univariate) 확률변수의 베이지안 모형에 사용되고 디리클레분포는 0과 1사이의 값을 가지는 다변수(multivariate) 확률변수의 베이지안 모형에 사용된다. - 출처 : [데이터 사이언스 스쿨] math 8.7 베.. 2021. 5. 4.
[데이터 사이언스 스쿨] math 8.6 다변수정규분포 ● 다변수정규분포(MVN: multivariate Gaussian normal distribution) 다변수정규분포에서 공분산행렬은 양의 정부호인 대칭행렬이어야 한다. 따라서 역행렬이 항상 존재한다. 공분산행렬의 역행렬을 정밀도행렬(precision matrix)이라고 한다. ● 다변수정규분포와 고윳값 분해 - 출처 : [데이터 사이언스 스쿨] math 8.6 다변수정규분포 2021. 5. 4.
[데이터 사이언스 스쿨] math 8.5 스튜던트 t분포, 카이제곱분포, F분포 ● 스튜던트 t분포 : 팻 테일을 보이는 데이터 모형에 적합한 것 ● t 통계량 : 정규분포로부터 얻은 N개의 표본 x1,⋯,xN에서 계산한 표본평균을 표본표준편차로 정규화한 값 ● 카이제곱분포(chi-squared) : NN개의 표본들을 단순히 더하는 것이 아니라 제곱을 하여 더하면 양수값만을 가지는 분포가 된다. 이 분포를 말한다. ● F분포 - 출처 : [데이터 사이언스 스쿨] math 8.5 스튜던트 t분포, 카이제곱분포, F분포 2021. 5. 4.