본문 바로가기

bow3

[딥러닝을이용한 자연어 처리 입문] 0402 Bag of Words(BoW) 1. Bag of Words란? - 단어들의 순서는 전혀 고려하지 않고, 단어들의 출현 빈도(frequency)에만 집중하는 텍스트 데이터의 수치화 표현 방법 - 만드는 과정 우선, 각 단어에 고유한 정수 인덱스를 부여 각 인덱스의 위치에 단어 토큰의 등장 횟수를 기록한 벡터 생성 3. CountVectorizer 클래스로 BoW 만들기 4. 블용어를 제거한 BoW 만들기 - 출처 : [딥러닝을이용한 자연어 처리 입문] 0402 Bag of Words(BoW) 2021. 5. 16.
[KoreaUniv DSBA] 강필성 교수: 04_Text_Representation_I_Classic_Methods_Kor Unstructured Data Analysis 04_Text_Representation_I_Classic_Methods_Kor - Bag-of-Words - TF-IDF - N-Grams https://github.com/pilsung-kang/text-... 2021. 3. 1.
[iitp] 다음 쓸 문장을 자동으로 알려주는 G메일 스마트 컴포즈 Smart Compose [구글 스마트 컴포즈 인공지능의 언어생성 모델 RNN-LM] *** 출처: [iitp] 다음 쓸 문장을 자동으로 알려주는 G메일 스마트 컴포즈 Smart Compose *** 문서: ■ 스마트 컴포즈 Smart Compose - 아직은 영어만 서비스 - 가령, 'How'를 입력하면 AI는 "How are you doing?" 이라는 문장을 생성, AI가 제시하는 문구는 회색으로 표시되며 탭을 누르면 검은색으로 바뀌며 문장이 확정됨 - 사용자들의 평은 기대 이상으로 편리하다고 함 - 상대방 이름은 AI가 이메일 주소를 보고 유추해 생성 - 메일의 인사말 워딩은 아주 다양하지만, AI는 이런 다양성을 학습하여 사용자의 의도가 명확히 판별되는 시점에서 문장을 완성하여 제시함 ■ 언어생성 모델 RNN-LM - .. 2018. 7. 19.