본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 5.3 레버지리와 아웃라이어

by manga0713 2021. 5. 10.

개별적인 데이터 표본 하나하나가 회귀분석 결과에 미치는 영향력은 레버리지 분석이나 아웃라이어 분석을 통해 알 수 있다.

 

레버리지(leverage) : 실제 종속변수값이 예측치(predicted target)에 미치는 영향을 나타낸 값

 

○ 아웃라이어(outlier) : 모형에서 설명하고 있는 데이터와 동떨어진 값을 가지는 데이터, 즉 잔차가 큰 데이터.

잔차의 크기는 독립 변수의 영향을 받으므로 아웃라이어를 찾으려면 이 영향을 제거한 표준화된 잔차를 계산해야 한다.

 

 

 

 

dss_ml17_1_leverage and outlier 레버리지와 아웃라이어.ipynb
0.26MB

 

- 출처 : [데이터 사이언스 스쿨] 5.3 레버지리와 아웃라이어