개별적인 데이터 표본 하나하나가 회귀분석 결과에 미치는 영향력은 레버리지 분석이나 아웃라이어 분석을 통해 알 수 있다.
○ 레버리지(leverage) : 실제 종속변수값이 예측치(predicted target)에 미치는 영향을 나타낸 값
○ 아웃라이어(outlier) : 모형에서 설명하고 있는 데이터와 동떨어진 값을 가지는 데이터, 즉 잔차가 큰 데이터.
잔차의 크기는 독립 변수의 영향을 받으므로 아웃라이어를 찾으려면 이 영향을 제거한 표준화된 잔차를 계산해야 한다.
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 6.1 모형 진단과 수정 (1) | 2021.05.10 |
---|---|
[데이터 사이언스 스쿨] 5.4 분산 분석과 모형 성능 ANOVA (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 5.1 확률론적 선형 회귀모형 probabilistic model (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.5 부분회귀 partial regression (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.4 범주형 독립변수를 가지는 경우의 회귀분석 (0) | 2021.05.10 |