분석 모델2 [데이터 사이언스 스쿨] 12.02 모형 결합 ○ 모형 결합(model combining) 방법은 앙상블 방법론(ensemble methods)이라고도 한다. 이는 특정한 하나의 예측 방법이 아니라 복수의 예측 모형을 결합하여 더 나은 성능의 예측을 하려는 시도이다. ○ 모형 결합의 효과 단일 모형을 사용할 때 보다 성능 분산 감소, 즉 과최적화를 방지. 개별 모형이 성능이 안좋을 경우 결합 모형의 성능이 더 향상. ○ 모형 결합 방법 - 취합(aggregation) 방법론 다수결 (Majority Voting) 배깅 (Bagging) 랜덤포레스트 (Random Forests) - 부스팅(boosting) 방법론 에이다부스트 (AdaBoost) 그레디언트 부스트 (Gradient Boost) - 출처 : [데이터 사이언스 스쿨] 12.02 모형 결합 2021. 5. 13. [데이터 사이언스 스쿨] 6.3 교차검증 cross validation ○ 표본내 성능 검증(in-sample testing) : 학습 데이터 집합의 종속 변수값을 얼마나 잘 예측하였는지를 나타내는 성능을검사하는것 ○ 표본외 성능 검증(out-of-sample testing, 교차검증(cross validation)) : 학습에 쓰이지 않는 표본 데이터 집합의 종속 변수 값을 얼마나 잘 예측하는가를 검사하는 것 ○ 과최적화(overfitting) : 표본내 성능은 좋으면서 표본외 성능이 상대적으로 떨어지는 경우 ○ 교차검증을 하려면 두 종류의 데이터 집합이 필요하다. 모형 추정 즉 학습을 위한 데이터 집합 (training data set) 성능 검증을 위한 데이터 집합 (test data set) ○ 보통은 가지고 있는 데이터 집합을 학습용과 검증용으로 나누어 학습용 데이.. 2021. 5. 11. 이전 1 다음