본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[D2] 한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 - 김명지, 임승영 님

by manga0713 2021. 3. 17.

 

- Slide

 

 

한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례

평문 Q&A 뿐 아니라 구조화된 문서에 대한 Q&A를 위해 TableQA, TreeQA 모델이 나오게 된 배경 및 차이점 등 LG CNS 연구 내용을 간략히 소개하고, 이를 위한 작업의 일환으로 제작했던 KorQuAD dataset 상세

www.slideshare.net

 

- 발표 영상

 

 

 

○ 영문 데이터셋

 

- SQuAD : Extractive MRC

- MS MARCO : Generative MRC

- HotPotQA : Multi hop MRC

 

○ 한글 데이터셋

 

- KorQuAD :

 

korquad/korquad.github.io

Korean wiki QA dataset for MRC. Contribute to korquad/korquad.github.io development by creating an account on GitHub.

github.com