○ 부트스트래핑(bootstrapping) : 회귀분석에 사용한 표본 데이터가 달라질 때 회귀분석의 결과는 어느 정도 영향을 받는지를 알기 위한 방법이다.
○ 위 summary는 확률론적 선형 회귀모형을 사용한 것이다. 확률론적 선형 회귀모형을 쓰면 부트스트래핑처럼 많은 계산을 하지 않아도 빠르고 안정적으로 가중치 추정값의 오차를 구할 수 있다.
○ 확률론적 선형 회귀모형에서는 데이터가 확률 변수로부터 생성된 표본이라고 가정한다.
- 선형 정규 분포 가정
- 외생성(exogeneity) 가정
- 조건부 독립 가정
- 등분산성 가정
○ 잔차의 분포 : 확률론적 선형 회귀모형에 따르면 회귀분석에서 생기는 잔차도 정규 분포를 따른다.
○ 단일 계수 t-검정 (Single Coefficient t-test)
○ 회귀분석 F-검정 : 여러 모형의 유의 확률을 비교하여 어느 모형이 더 성능이 좋은가를 비교할 때 이 유의 확률을 사용하는 검정을 Loss-of-Fit 검정 또는 **회귀분석 F-검정(regression F-test)**이라고 한다.
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 5.4 분산 분석과 모형 성능 ANOVA (0) | 2021.05.10 |
---|---|
[데이터 사이언스 스쿨] 5.3 레버지리와 아웃라이어 (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.5 부분회귀 partial regression (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.4 범주형 독립변수를 가지는 경우의 회귀분석 (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.3 스케일링 (0) | 2021.05.10 |