○ 실습 대상 데이터
- 약 15년 동안 발행되었던 뉴스 기사 제목을 모아놓은 영어 데이터(https://www.kaggle.com/therohk/million-headlines)
○ 텍스트 전처리
○ TF-IDF 행렬 만들기
○ 토픽 모델링
'IT 와 Social 이야기 > NLP 자연어처리' 카테고리의 다른 글
[딥러닝을이용한 자연어 처리 입문] 0706 텐서플로우를 사용한 로지스틱 회귀 실습 (0) | 2021.05.17 |
---|---|
[딥러닝을이용한 자연어 처리 입문] 0704 자동 미분과 선형 회귀 실습 (0) | 2021.05.17 |
[딥러닝을이용한 자연어 처리 입문] 0602 잠재 디리클레 할당 Latent Dirichlet Allocation, LDA (0) | 2021.05.17 |
[딥러닝을이용한 자연어 처리 입문] 0601 잠재 의미 분석 Latent Semantic Analysis, LSA (0) | 2021.05.17 |
[딥러닝을이용한 자연어 처리 입문] 0502 여러가지 유사도 기법 (0) | 2021.05.17 |