본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[딥러닝을이용한 자연어 처리 입문] 0502 여러가지 유사도 기법

by manga0713 2021. 5. 17.

1. 유클리드 거리(Euclidean distance)

 

- 다차원 공간에서 두개의 점 p q가 각각 p=(p1,p2,p3,...,pn) q=(q1,q2,q3,...,qn)의 좌표를 가질 때 두 점 사이의 거리를 계산

 

- 2차원 좌표 평면에서 두 점 사이의 유클리드 거리 공식은 피타고라스의 정리를 통해 두 점 사이의 거리를 구하는 것과 동일

 

 

2. 자카드 유사도(Jaccard similarity)

 

- 합집합에서 교집합의 비율을 구한다면 두 집합 A와 B의 유사도를 구할 수 있다는 것이 자카드 유사도(jaccard similarity)의 아이디어

 

- 0과 1사이의 값을 가지며, 만약 두 집합이 동일하다면 1, 두 집합의 공통 원소가 없다면 0

 

 

nlp_0502_similarity methods 여러가지 유사도 기법.ipynb
0.00MB

 

- 출처 : [딥러닝을이용한 자연어 처리 입문] 0502 여러가지 유사도 기법