본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 비대칭 데이터 문제 imbalanced data problem

by manga0713 2021. 5. 14.

○ 비대칭 데이터 문제(imbalanced data problem) : 각 클래스에 속한 데이터의 갯수의 차이에 의해 발생하는 문제들

 

○ 비대칭 데이터는 다수 클래스 데이터에서 일부만 사용하는 언더 샘플링이나 소수 클래스 데이터를 증가시키는 오버 샘플링을 사용하여 데이터 비율을 맞추면 정밀도(precision)가 향상된다.

 

 

 

dss_ml35_1_imbalanced data problem 비대칭데이터문제.ipynb
0.38MB

 

- 출처 : [데이터 사이언스 스쿨] 비대칭 데이터 문제 imbalanced data problem