본문 바로가기

MRC2

[D2] 한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 - 김명지, 임승영 님 - Slide 한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 평문 Q&A 뿐 아니라 구조화된 문서에 대한 Q&A를 위해 TableQA, TreeQA 모델이 나오게 된 배경 및 차이점 등 LG CNS 연구 내용을 간략히 소개하고, 이를 위한 작업의 일환으로 제작했던 KorQuAD dataset 상세 www.slideshare.net - 발표 영상 ○ 영문 데이터셋 - SQuAD : Extractive MRC - MS MARCO : Generative MRC - HotPotQA : Multi hop MRC ○ 한글 데이터셋 - KorQuAD : korquad/korquad.github.io Korean wiki QA dataset for MRC. Contr.. 2021. 3. 17.
[D2] 어떻게 해야 기계에게 글을 잘 읽고 말할 수 있게 할까? - 이현구님 어떻게 해야 기계에게 글을 잘 읽고 말할 수 있게 할까? SQuAD가 공개되고 널리 알려지면서 기계독해(Machine Reading Comprehension)가 각광받기 시작했습니다. SQuAD란 스탠포드대에서 만든, 기계가 주어진 문서를 읽고 그와 관련된 질문을 할 경우 정답을 찾아 www.slideshare.net ○ 모델들의 공통적인 구조 - Encoder : 질의와 문맥을 벡터로 표현 - Co-attention : 상호 Attention을 통해 문맥과 질의 간의 관계 파악 - Output : 질문에 해당하는 정답 단어의 시작과 끝 위치 출력 ○ 학습 방법 - Negative Log Probability - REINFORCE Algorithm ○ 어디까지 왔나? - 사람과 유사, 혹은 더욱 잘하게 .. 2021. 3. 16.