본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 5.4 분산 분석과 모형 성능 ANOVA

by manga0713 2021. 5. 10.

○ 분산 분석(ANOVA: Analysis of Variance)은 종속변수의 분산과 독립변수의 분산간의 관계를 사용하여 선형회귀분석의 성능을 평가하고자 하는 방법이다.

 

- 서로 다른 두 개의 선형회귀분석의 성능 비교에 응용할 수 있으며 독립변수가 카테고리 변수인 경우 각 카테고리 값에 따른 영향을 정량적으로 분석하는데도 사용된다.

 

 

 

○ 결정계수(Coefficient of Determination) : 회귀분석의 성능을 나타내는 수치

 

 

dss_ml18_1_anova 분산 분석과 모형 성능.ipynb
0.05MB

 

- 출처: [데이터 사이언스 스쿨] 5.4 분산 분석과 모형 성능 ANOVA