본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[D2] 모두를 위한 기계번역 - 박찬준님

by manga0713 2021. 3. 19.

 

- 발표영상

 

 

 

- 슬라이드

 

 

Mt

모두를 위한 기계번역 (박찬준) ○ 개요 2014년 본격적으로 NMT에 대한 연구가 진행되었으며 현재는 Transformer 기반의 다양한 NMT 시스템들이 연구되고 있습니다. 더 나아가 최근 NLP에서 가장 뜨거운

www.slideshare.net

 

5. NMT 하위 분야

 

○ Automatic Post Editing(APE): 번역문 사후 교정

- 기계 번역 시스템이 생성한 결과물에 포함되어 있는 오류를 수정하여 더 나은 품질의 번역문을 만들어내는 과정

 

 

○ Quality Estimation(QE)

- 정답번역문의 참고 없이 기계번역문당의 번역품질을 예측하는 것

 

○ Parallel Corpus Filtering

- 양질의 Parallel Corpus를 구축하기 위한 작업이며 좋은 품질의 Corpus만을 선별하는 작업을 의미

 

○ 실시간 강연통역

- 한 문장씩 통역하는 기술을 넘어, 연속된 자유 발화를 통력사처럼 실시간으로 통역해 사용자에게 제공하는 방식

 

○ Simultaneous Speech Translation

- 음성 to 음성. 번역기가 없는 통역 시스템

 

 

6. Open Source

 

- OpenNMT

 

OpenNMT - Open-Source Neural Machine Translation

nmt-wizard Tasks launcher and monitor on remote platforms (SSH, EC2, etc.).

opennmt.net

 

- Tensor2Tensor

 

tensorflow/tensor2tensor

Library of deep learning models and datasets designed to make deep learning more accessible and accelerate ML research. - tensorflow/tensor2tensor

github.com

 

- Fairseq

 

pytorch/fairseq

Facebook AI Research Sequence-to-Sequence Toolkit written in Python. - pytorch/fairseq

github.com

 

- OpenKiwi

 

Unbabel/OpenKiwi

Open-Source Machine Translation Quality Estimation in PyTorch - Unbabel/OpenKiwi

github.com

 

- zipporah

 

hainan-xv/zipporah

Contribute to hainan-xv/zipporah development by creating an account on GitHub.

github.com

 

- Corpora Cleaning Tools

 

M4t1ss/parallel-corpora-tools

Tools for filtering and cleaning parallel and monolingual corpora for machine translation and other natural language processing tasks. - M4t1ss/parallel-corpora-tools

github.com

 

7. 기계번역 서비스 과정

 

 

 

- github.com/Parkchanjun/OpenNMT-Colab-Tutorial

 

Parkchanjun/OpenNMT-Colab-Tutorial

OpenNMT Colab Tutorial Pytorch && Tensorflow. Contribute to Parkchanjun/OpenNMT-Colab-Tutorial development by creating an account on GitHub.

github.com