본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 디비스캔 군집화

by manga0713 2021. 5. 14.

○ 디비스캔(DBSCAN: Density-Based Spatial Clustering of Applications with Noise) 군집화 방법은 데이터가 밀집한 정도 즉 밀도를 이용한다. 디비스캔 군집화는 군집의 형태에 구애받지 않으며 군집의 갯수를 사용자가 지정할 필요가 없다. 디비스캔 군집화 방법에서는 초기 데이터로부터 근접한 데이터를 찾아나가는 방법으로 군집을 확장한다. 이 때 다음 사용자 인수를 사용한다.

  • 최소 거리 ε: 이웃(neighborhood)을 정의하기 위한 거리
  • 최소 데이터 갯수(minimum points): 밀집지역을 정의하기 위해 필요한 이웃의 갯수

 

 

dss_ml38_3_dbsan clustering.ipynb
0.18MB

 

- 출처 : [데이터 사이언스 스쿨] 디비스캔 군집화