본문 바로가기

IT 와 Social 이야기/NLP 자연어처리

[edwith] 딥러닝을 이용한 자연어 처리 : Case Study - Learning to Describe Multimedia - 조경현교수

by manga0713 2021. 3. 20.

[LECTURE] Learning to Describe Multimedia : edwith

학습목표 자연어 뿐만 아니라 멀티미디어 컨텐츠로서 기계번역 매커니즘을 확장해봅니다. 핵심키워드 기계 번역(Machine Translation) 연속 벡터 공간(Continious ... - 커넥트재단

www.edwith.org

학습내용

Input 굳이 문장, 텍스트여야만 하는가?

Input 데이터를 연속 벡터 공간(Continious vector space)에 인코딩 하기만 하면, 어떤 Input 데이터든 상관이 없습니다.
인코딩 된 벡터는 사람의 눈으로 볼 수 없는 방식으로 중요 요소만 남아있기 때문에 여러 멀티미디어로 확장할 수 있었습니다.

Image Caption Generation
- Input: 이미지
- Output: 이미지 캡션
- 아키텍쳐:
  - 인코더(Encoder): Deep convolution network
  - 디코더(Decoder): Recurrent language model + attention machanism

Video Description Generation
- Input: 동영상 클립(일련의 비디오 프레임)
- Output: 동영상에 대한 설명문장
- 아키텍쳐:
  - 인코더(Encoder): Deep 2+3D convolution network
  - 디코더(Decoder): Recurrent language model + attention machanism

Speech recognition
- Input: 스피치(음성 데이터)
- Output: 음성에 대한 자막
- 아키텍쳐:
  - 인코더(Encoder): Convolution + recurrent acoustic network
  - 디코더(Decoder): Conditional recurrent language model + attention machanism

학습자료

case study 1 - multimedia description.pdf

- 출처: [edwith] 딥러닝을 이용한 자연어 처리 : Case Study - Learning to Describe Multimedia - 조경현교수

저작자표시 (새창열림)

'IT 와 Social 이야기 > NLP 자연어처리' 카테고리의 다른 글

[edwith] 딥러닝을 이용한 자연어 처리 : Case Study - Meta-Learning of Low-Resource Neural Machine Translation - 조경현교수 (0)	2021.03.20
[edwith] 딥러닝을 이용한 자연어 처리 : Case Study - Fully Character-Level Machine Translation - 조경현교수 (0)	2021.03.20
[D2] 모두를 위한 기계번역 - 박찬준님 (0)	2021.03.19
[edwith] 딥러닝을 이용한 자연어 처리 : Q n A - Neural Machine Translation - 조경현교수 (0)	2021.03.19
[edwith] 딥러닝을 이용한 자연어 처리 : RNN Neural Machine Translation - 조경현교수 (0)	2021.03.19

티스토리툴바