[딥러닝을이용한 자연어 처리 입문] 1503 BLEU Score(Bilingual Evaluation Understudy Score)

1. BLEU Score(Bilingual Evaluation Understudy Score)

- n-gram 기반의 기계 번역 성능 측정 방법

- 언어에 구애받지 않음

- 계산 속도가 빠름

1) 단어 개수 카운트로 측정하기(Unigram Precision)

Ca : 번역된 문장

Ref : 정답 문장

2) 중복을 제거하여 보정하기(Modified Unigram Precision)

3) 보정된 유니그램 정밀도 (Modified Unigram Precision) 구현하기

4) 순서를 고려하기 위해서 n-gram으로 확장하기 필요

5) 짧은 문장 길이에 대한 패널티(Brevity Penalty) 적용 필요

2. NLTK를 사용한 BLEU 측정하기

- 파이썬에서는 NLTK 패키지를 사용하여 BLEU를 계산할 수 있음

[딥러닝을이용한 자연어 처리 입문] 1602 바다나우 어텐션(Bahdanau Attention) (0)	2021.06.03
[딥러닝을이용한 자연어 처리 입문] 1601 어텐션 메커니즘 (Attention Mechanism) (0)	2021.06.02
[딥러닝을이용한 자연어 처리 입문] 1502 Word-Level 번역기 만들기(Neural Machine Translation (seq2seq) Tutorial) (0)	2021.06.01
[딥러닝을이용한 자연어 처리 입문] 1501 시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq) (0)	2021.06.01
[딥러닝을이용한 자연어 처리 입문] 1403 서브워드텍스트인코더 (SubwordTextEncoder) (0)	2021.05.28

망가천재의 스토리텔링