본문 바로가기

분류3

[데이터 사이언스 스쿨] 커널 서포트 벡터 머신 퍼셉트론이나 서포트 벡터 머신과 같은 선형판별함수 분류모형은 XOR(exclusive OR) 문제를 선형판별평면(decision hyperplane)으로 영역을 나눌 수 없기 때문 풀지 못한다. 기저함수를 써서 XOR 문제의 데이터를 변환하면 특성 ϕ2ϕ2를 사용하여 클래스 분류를 할 수 있다. ○ 커널 사용의 장점 : 커널을 사용하면 베이시스 함수를 하나씩 정의하는 수고를 덜 수 있을뿐더러 변환과 내적에 들어가는 계산량이 줄어든다. ○ 많이 사용되는 커널 - 다항 커널 (Polynomial Kernel) - RBF(Radial Basis Function) 또는 가우시안 커널(Gaussian Kernel) - 시그모이드 커널 (Sigmoid Kernel) 2021. 5. 13.
[데이터 사이언스 스쿨] 7.1 선형판별분석법과 이차판별분석법 선형판별분석법(linear discriminant analysis, LDA)과 이차판별분석법(quadratic discriminant analysis, QDA)는 대표적인 확률론적 생성모형(generative model)이다. 가능도 즉, y의 클래스값에 따른 x의 분포에 대한 정보를 먼저 알아낸 후, 베이즈 정리를 사용하여 주어진 x에 대한 y의 확률분포를 찾아낸다. - 출처 : [데이터 사이언스 스쿨] 7.1 선형판별분석법과 이차판별분석법 2021. 5. 12.
[데이터 사이언스 스쿨] 5.4 분류 성능평가 ○ scikit learn 패키지에서 지원하는 분류 성능평가 명령 confusion_matrix(y_true, y_pred) accuracy_score(y_true, y_pred) precision_score(y_true, y_pred) recall_score(y_true, y_pred) fbeta_score(y_true, y_pred, beta) f1_score(y_true, y_pred) classfication_report(y_true, y_pred) roc_curve auc - 출처 : [데이터 사이언스 스쿨] 5.4 분류 성능평가 2021. 5. 12.