본문 바로가기

학습모델2

[K-ICT 빅데이터센터] Ch10. 온라인 광고 클릭 예측 모델링2-로지스틱회귀-임정환교수 주요정리 로지스틱 회귀의 반응 변수는 긍정(양성) 클래스의 확률 값을 가진다. 로지스틱 회귀의 반응 변수 값이 임계치 이상이면 긍정(양성) 클래스를 예측하고, 임계치 미만이면 부정(음성) 클래스를 예측한다. 반응 변수는 '로지스틱 함수(시그모이드 함수)'를 사용해 특징의 선형 조합 함수로 모델링된다. ★ 강의자료, 소스코드 다운받기 : https://kbig.kr/portal/kbig/datacube/... 2021. 4. 8.
[K-ICT 빅데이터센터] Ch6. 파이썬 교차검증, 특징공학-임정환교수 주요 정리 1. 교차검증을 사용하면 모델을 훈련시킬 데이터를 빠뜨릴 수 있는 문제를 방지할 수 있다. 2. 검증곡선을 시각화하면 모델의 복잡도와 관련된 편향과 분산 사이의 트레이드오프에서 적절한 지점을 확인할 수 있다. 3. 학습곡선 플롯을 이용하면 훈련집합의 크기에 따른 훈련 점수와 검증 점수의 변화를 시각적으로 확인할 수 있다. 4. 그리드 서치 자동화 도구를 이용하면 검증 점수를 최대화하는 최적의 모델을 찾아 데이터에 적합시킬 수 있다. 5. 특징 공학을 통해 머신러닝의 특징 행렬을 구축하는데 필요한 범주형 데이터의 인코딩, 복잡도를 증가시키기 위한 유도 특징의 추가, 누락 데이터 대체 등의 작업을 수행하며, 파이프라인을 통해 작업의 생산성을 높일 수 있다. ★ 강의자료, 소스코드 다운받기 : ht.. 2021. 4. 5.