- 다항 기저함수(polynomial basis function)
- 직교기저함수(orthogonal basis function)
- 방사 기저함수
- 삼각 기저함수
- 시그모이드 기저함수
○ 과최적화(overfitting) : 모형을 특정 샘플 데이터에 대해 과도하게 최적화하는 것
- 독립 변수 데이터 갯수에 비해 모형 모수의 수가 과도하게 크거나
- 독립 변수 데이터가 서로 독립이 아닌 경우에 발생한다.
○ 과최적화가 문제가 되는 이유
- 트레이닝에 사용되지 않은 새로운 독립 변수 값을 입력하면 오차가 커진다. (cross-validation 오차)
- 샘플이 조금만 변화해도 가중치 계수의 값이 크게 달라진다. (추정의 부정확함)
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 6.4 다중공선성과 변수 선택 (0) | 2021.05.11 |
---|---|
[데이터 사이언스 스쿨] 6.3 교차검증 cross validation (0) | 2021.05.11 |
[데이터 사이언스 스쿨] 6.1 모형 진단과 수정 (1) | 2021.05.10 |
[데이터 사이언스 스쿨] 5.4 분산 분석과 모형 성능 ANOVA (0) | 2021.05.10 |
[데이터 사이언스 스쿨] 5.3 레버지리와 아웃라이어 (0) | 2021.05.10 |