본문 바로가기

scipy10

[데이터 사이언스 스쿨] math 9.5 사이파이를 사용한 검정 ● SciPy를 사용한 검정 이항검정(Binomial Test) 카이제곱검정(Chi-squared Test) 카이제곱 독립검정(Chi-squared Contingency Test) 단일표본 z검정(One-sample z-Test) 단일표본 t검정(One-sample t-Test) 독립표본 t검정(Independent two-sample t-Test) 대응표본 t검정(Paired two-sample t-Test) 등분산검정(Equal-variance Test) 정규성검정(Normality Test) - 출처 : [데이터 사이언스 스쿨] math 9.5 사이파이를 사용한 검정 2021. 5. 5.
[데이터 사이언스 스쿨] math 8.7 베타분포, 감마분포, 디리클레분포 베타분포, 감마분포, 디리클레분포는 모숫값을 조정하여 분포의 모양을 우리가 원하는대로 쉽게 바꿀 수 있다. 모숫값은 분포 모양을 조절하는 조절값이라고 생각하면 된다. 이러한 특성때문에 이 분포들은 데이터가 이루는 분포를 표현하기보다는 베이지안 확률론의 관점에서 어떤 값에 대해 우리가 가지고 있는 확신 혹은 신뢰의 정도를 표현하는데 주로 사용된다. ● 디리클레분포(dirichlet distribution) 베타분포의 확장판이라고 할 수 있다. 베타분포는 0과 1사이의 값을 가지는 단일(univariate) 확률변수의 베이지안 모형에 사용되고 디리클레분포는 0과 1사이의 값을 가지는 다변수(multivariate) 확률변수의 베이지안 모형에 사용된다. - 출처 : [데이터 사이언스 스쿨] math 8.7 베.. 2021. 5. 4.
[데이터 사이언스 스쿨] math 8.6 다변수정규분포 ● 다변수정규분포(MVN: multivariate Gaussian normal distribution) 다변수정규분포에서 공분산행렬은 양의 정부호인 대칭행렬이어야 한다. 따라서 역행렬이 항상 존재한다. 공분산행렬의 역행렬을 정밀도행렬(precision matrix)이라고 한다. ● 다변수정규분포와 고윳값 분해 - 출처 : [데이터 사이언스 스쿨] math 8.6 다변수정규분포 2021. 5. 4.
[데이터 사이언스 스쿨] math 8.3 카테고리분포와 다항분포 ● 카테고리 확률변수(Categorical random variable)는 1부터 K까지 K개 정숫값 중 하나가 나온다. 이 정숫값을 범주값, 카테고리(category) 혹은 클래스(class)라고 한다. 주사위를 던져 나오는 눈금 수는 K=6인 카테고리분포다. 주의할 점은 원래 카테고리는 스칼라값이지만 카테고리 확률변수는 1과 0으로만 이루어진 다차원 벡터를 출력한다. 숫자를 이렇게 변형하는 것을 원핫인코딩(One-Hot-Encoding)이라고 한다. ● 다중 분류문제(multi-class classification) - 출처 : [데이터 사이언스 스쿨] math 8.3 카테고리분포와 다항분포 2021. 5. 4.