본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 5.1 확률론적 선형 회귀모형 probabilistic model

by manga0713 2021. 5. 10.

○ 부트스트래핑(bootstrapping) : 회귀분석에 사용한 표본 데이터가 달라질 때 회귀분석의 결과는 어느 정도 영향을 받는지를 알기 위한 방법이다.

 

- 기존의 데이터를 재표본화(re-sampling)하여 여러가지 다양한 표본 데이터 집합을 만드는 방법을 사용한다. 재표본화는 기존의 N개의 데이터에서 다시 N개의 데이터를 선택하되 중복 선택도 가능하게 한다(unordered resampling with replacement).

 

 

 

○ 위 summary는 확률론적 선형 회귀모형을 사용한 것이다. 확률론적 선형 회귀모형을 쓰면 부트스트래핑처럼 많은 계산을 하지 않아도 빠르고 안정적으로 가중치 추정값의 오차를 구할 수 있다.

 

확률론적 선형 회귀모형에서는 데이터가 확률 변수로부터 생성된 표본이라고 가정한다.

 

- 선형 정규 분포 가정

- 외생성(exogeneity) 가정

- 조건부 독립 가정

- 등분산성 가정

 

○ 잔차의 분포 : 확률론적 선형 회귀모형에 따르면 회귀분석에서 생기는 잔차도 정규 분포를 따른다.

 

 

 

○ 단일 계수 t-검정 (Single Coefficient t-test)

 

 

 

○ 회귀분석 F-검정 : 여러 모형의 유의 확률을 비교하여 어느 모형이 더 성능이 좋은가를 비교할 때 이 유의 확률을 사용하는 검정을 Loss-of-Fit 검정 또는 **회귀분석 F-검정(regression F-test)**이라고 한다.

 

dss_ml16_1_probabilistic linear regression model 확률론적 선형회귀모형.ipynb
0.09MB

 

- 출처 : [데이터 사이언스 스쿨] 5.1 확률론적 선형 회귀모형 probabilistic model