- 풀랭크(full-rank) 방식에서는 더미변수의 값을 원핫인코딩(one-hot-encoding) 방식으로 지정
○ 풀랭크
○ 축소랭크
○ 두 개 이상의 범주형 변수가 있는 경우
- 축소형 방식을 사용한다. 이 때 주의할 점은 모든 범주형 범수의 가중치는 기준값 상수항에 더해지는 상수항으로 취급된다.
○ 범주형 독립변수와 실수 독립변수의 상호작용
- 만약 범주형 변수의 값이 달라질 때 상수항만 달라지는 것이 아니라 다른 독립변수들이 미치는 영향도 달라지는 모형을 원한다면 상호작용(interaction)을 쓰면 된다.
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 5.1 확률론적 선형 회귀모형 probabilistic model (0) | 2021.05.10 |
---|---|
[데이터 사이언스 스쿨] 4.5 부분회귀 partial regression (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.3 스케일링 (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.2 선형회귀분석 linear regression analysis의 기초 (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 4.1 회귀분석 regression analysis 예제 (0) | 2021.05.09 |