1. BLEU Score(Bilingual Evaluation Understudy Score)
- n-gram 기반의 기계 번역 성능 측정 방법
- 언어에 구애받지 않음
- 계산 속도가 빠름
1) 단어 개수 카운트로 측정하기(Unigram Precision)
Ca : 번역된 문장
Ref : 정답 문장
2) 중복을 제거하여 보정하기(Modified Unigram Precision)
3) 보정된 유니그램 정밀도 (Modified Unigram Precision) 구현하기
4) 순서를 고려하기 위해서 n-gram으로 확장하기 필요
5) 짧은 문장 길이에 대한 패널티(Brevity Penalty) 적용 필요
2. NLTK를 사용한 BLEU 측정하기
- 파이썬에서는 NLTK 패키지를 사용하여 BLEU를 계산할 수 있음
[ 참조 사이트 : https://www.nltk.org/_modules/nltk/translate/bleu_score.html ]
- 출처 : [딥러닝을이용한 자연어 처리 입문] 1503 BLEU Score(Bilingual Evaluation Understudy Score)