본문 바로가기

Text Representation4

[edwith] 딥러닝을 이용한 자연어 처리 : Text Classification & Text Representation - Summary - 조경현교수 [LECTURE] Summary : edwith 학습목표 지금까지 배운 "텍스트 분류문제"와 "문장표현"에 대해서 다시 한번 정리하고 복습합니다 핵심키워드 텍스트 분류(Text Classification) 문장표현(Senten... - 커넥트재단 www.edwith.org 핵심키워드 텍스트 분류(Text Classification) 문장표현(Sentence Representation) - 출처: [edwith] 딥러닝을 이용한 자연어 처리 : Text Classification & Text Representation - Summary - 조경현교수 2021. 3. 17.
[edwith] 딥러닝을 이용한 자연어 처리 : Self Attention & RNN - 조경현교수 [LECTURE] Self Attention & RNN : edwith 학습목표 문장을 표현하는 방법중 Self Attention 과 RNN 에 대해서 알아봅니다. 핵심키워드 Self Attention Recurrent Neural Network - 커넥트재단 www.edwith.org 학습내용 지난 시간이 이야기한 CNN 과 RN 의 관계를 살펴보면 아래와 같습니다. RN: 모든 다른 토큰의 관계를 봅니다. 모든 단어간의 관계를 봐서 효율적이지 못합니다. CNN: 작은 범위의 토큰의 관계를 봅니다. 따라서 더 먼 거리의 단어간의 관계가 있을 경우 탐지할 수 없거나 더 많은 convolution 층을 쌓아야합니다. 하지만 CNN 방식을 가중치가 부여된 RN의 일종으로 볼 수도 있습니다. 그렇다면 가중치가.. 2021. 3. 17.
[edwith] 딥러닝을 이용한 자연어 처리 : How to represent sentence & token? - 조경현교수 [LECTURE] How to represent sentence & token? : edwith 학습목표 문장을 어떻게 컴퓨터 언어로 표현할지 배웁니다. 핵심키워드 토큰(tokens) 단어장(Vocabulary) 인코딩(Encoding) 연속 벡터 공간(Continuous v... - 커넥트재단 www.edwith.org 학습내용 문장은 일련의 토큰(tokens)으로 구성되어 있습니다. 텍스트 토큰은 주관적, 임의적(arbitrary)인 성격을 띄고 있습니다. 토큰을 나누는 기준은 다양합니다. 공백(White space) 형태소(Morphs) 어절 비트숫자 컴퓨터에게 단어를 숫자로 표현하기 위해서, 단어장(Vocabulary)을 만들고, 중복되지 않는 인덱스(index) 로 바꿉니다. 궁극적으로 모든 문.. 2021. 3. 17.
[edwith] 딥러닝을 이용한 자연어 처리 : Text Classification & Sentence Representation - Overview - 조경현교수 [LECTURE] Overview : edwith 학습목표 자연어 처리에서 텍스트 분류 문제를 다뤄봅니다. 핵심키워드 텍스트 분류(Text Classification) 문장표현(Sentence Representation) - 커넥트재단 www.edwith.org 학습내용 텍스트 분류(Text Classification): 문장, 문단 또는 글을 어떤 카테고리에 분류하는 작업을 텍스트 분류라고 합니다. 텍스트 분류는 지도학습입니다. Input: 하나의 문장, 문단 혹은 문서 Output: 유한한 C 개의 카테고리 예시 감성 분석 카테고리 분류 의도 분류 - 출처: [edwith] 딥러닝을 이용한 자연어 처리 : Text Classification & Sentence Representation - Overv.. 2021. 3. 17.