본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] math 7.5 공분산과 상관계수

by manga0713 2021. 5. 4.

● 표본공분산(sample covariance) : 자료가 평균값으로부터 얼마나 떨어져 있는지를 나타낸 것이다. 공분산은 평균값 위치와 표본 위치를 연결하는 사각형의 면적을 사용한다. 데이터가 1사분면이나 3사분면에 있는 경우에는 양수가 되고 데이터가 2사분면이나 4사분면에 있는 경우에는 음수가 된다.

 

● 표본상관계수(sample correlation coefficient) : 다른 종류의 상관계수와 비교하여 말하는 경우에는 피어슨(Pearson) 상관계수라고 하기도 한다.

 

 

 

 

● 비선형상관관계 : 선형이 아닌 상관관계를 비선형 상관관계라고 한다. 피어슨 상관계수는 두 확률변수의 관계가 선형적일 때만 상관관계를 제대로 계산할 수 있다.

 

 

dss_math7_5_covariance 공분산.ipynb
0.09MB

 

 

- 출처 : [데이터 사이언스 스쿨] math 7.5 공분산과 상관계수