본문 바로가기

IT 와 Social 이야기/Python348

[데이터 사이언스 스쿨] 커널 서포트 벡터 머신 퍼셉트론이나 서포트 벡터 머신과 같은 선형판별함수 분류모형은 XOR(exclusive OR) 문제를 선형판별평면(decision hyperplane)으로 영역을 나눌 수 없기 때문 풀지 못한다. 기저함수를 써서 XOR 문제의 데이터를 변환하면 특성 ϕ2ϕ2를 사용하여 클래스 분류를 할 수 있다. ○ 커널 사용의 장점 : 커널을 사용하면 베이시스 함수를 하나씩 정의하는 수고를 덜 수 있을뿐더러 변환과 내적에 들어가는 계산량이 줄어든다. ○ 많이 사용되는 커널 - 다항 커널 (Polynomial Kernel) - RBF(Radial Basis Function) 또는 가우시안 커널(Gaussian Kernel) - 시그모이드 커널 (Sigmoid Kernel) 2021. 5. 13.
[데이터 사이언스 스쿨] 서포트 벡터 머신 퍼셉트론은 가장 단순하고 빠른 판별 함수 기반 분류 모형이지만 판별 경계선(decision hyperplane)이 유니크하게 존재하지 않는다는 특징이 있다. 서포트 벡터 머신(SVM: support vector machine)은 퍼셉트론 기반의 모형에 가장 안정적인 판별 경계선을 찾기 위한 제한 조건을 추가한 모형이라고 볼 수 있다. - 출처 : [데이터 사이언스 스쿨] 서포트 벡터 머신 2021. 5. 13.
[데이터 사이언스 스쿨] 부스팅 방법 부스트(boost) 방법은 미리 정해진 갯수의 모형 집합을 사용하는 것이 아니라 하나의 모형에서 시작하여 모형 집합에 포함할 개별 모형을 하나씩 추가한다. 또한 부스트 방법은 이진 분류에만 사용할 수 있으며 yy값은 1또는 -1의 값을 가진다. - 출처 : [데이터 사이언스 스쿨] 부스팅 방법 2021. 5. 13.
[데이터 사이언스 스쿨] 12.02 모형 결합 ○ 모형 결합(model combining) 방법은 앙상블 방법론(ensemble methods)이라고도 한다. 이는 특정한 하나의 예측 방법이 아니라 복수의 예측 모형을 결합하여 더 나은 성능의 예측을 하려는 시도이다. ○ 모형 결합의 효과 단일 모형을 사용할 때 보다 성능 분산 감소, 즉 과최적화를 방지. 개별 모형이 성능이 안좋을 경우 결합 모형의 성능이 더 향상. ○ 모형 결합 방법 - 취합(aggregation) 방법론 다수결 (Majority Voting) 배깅 (Bagging) 랜덤포레스트 (Random Forests) - 부스팅(boosting) 방법론 에이다부스트 (AdaBoost) 그레디언트 부스트 (Gradient Boost) - 출처 : [데이터 사이언스 스쿨] 12.02 모형 결합 2021. 5. 13.