본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[딥러닝을이용한 자연어 처리 입문] 1503 BLEU Score(Bilingual Evaluation Understudy Score)

by manga0713 2021. 6. 2.

1. BLEU Score(Bilingual Evaluation Understudy Score)

 

- n-gram 기반의 기계 번역 성능 측정 방법

- 언어에 구애받지 않음

- 계산 속도가 빠름

 

1) 단어 개수 카운트로 측정하기(Unigram Precision)

 

Ca : 번역된 문장

Ref : 정답 문장

 

 

 

2) 중복을 제거하여 보정하기(Modified Unigram Precision)

 

 

 

3) 보정된 유니그램 정밀도 (Modified Unigram Precision) 구현하기

 

 

4) 순서를 고려하기 위해서 n-gram으로 확장하기 필요

5) 짧은 문장 길이에 대한 패널티(Brevity Penalty) 적용 필요

 

 

2. NLTK를 사용한 BLEU 측정하기

 

- 파이썬에서는 NLTK 패키지를 사용하여 BLEU를 계산할 수 있음

 

[ 참조 사이트 : https://www.nltk.org/_modules/nltk/translate/bleu_score.html ]

 

 

nlp_1503_bleu_score.ipynb
0.01MB

 

- 출처 : [딥러닝을이용한 자연어 처리 입문] 1503 BLEU Score(Bilingual Evaluation Understudy Score)