본문 바로가기

LDA4

[딥러닝을이용한 자연어 처리 입문] 0603 잠재 디리클레 할당(LDA) 실습2 ○ 실습 대상 데이터 - 약 15년 동안 발행되었던 뉴스 기사 제목을 모아놓은 영어 데이터(https://www.kaggle.com/therohk/million-headlines) ○ 텍스트 전처리 ○ TF-IDF 행렬 만들기 ○ 토픽 모델링 - 출처 : [딥러닝을이용한 자연어 처리 입문] 0603 잠재 디리클레 할당(LDA) 실습2 2021. 5. 17.
[딥러닝을이용한 자연어 처리 입문] 0602 잠재 디리클레 할당 Latent Dirichlet Allocation, LDA 1. 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 개요 - 문서의 집합으로부터 어떤 토픽이 존재하는지를 알아내기 위한 알고리즘 - 단어의 순서는 신경쓰지 않음 - LDA 와 LSA의 차이 LSA : DTM을 차원 축소 하여 축소 차원에서 근접 단어들을 토픽으로 묶는다. LDA : 단어가 특정 토픽에 존재할 확률과 문서에 특정 토픽이 존재할 확률을 결합확률로 추정하여 토픽을 추출한다. - 출처 : [딥러닝을이용한 자연어 처리 입문] 0602 잠재 디리클레 할당 Latent Dirichlet Allocation, LDA 2021. 5. 17.
[데이터 사이언스 스쿨] 7.1 선형판별분석법과 이차판별분석법 선형판별분석법(linear discriminant analysis, LDA)과 이차판별분석법(quadratic discriminant analysis, QDA)는 대표적인 확률론적 생성모형(generative model)이다. 가능도 즉, y의 클래스값에 따른 x의 분포에 대한 정보를 먼저 알아낸 후, 베이즈 정리를 사용하여 주어진 x에 대한 y의 확률분포를 찾아낸다. - 출처 : [데이터 사이언스 스쿨] 7.1 선형판별분석법과 이차판별분석법 2021. 5. 12.
[KISDI] 텍스트자료를 활용한 ICT이슈 탐지 및 분석 방법론 연구 [ 연구의 구성 및 개요 ] *** 출처: [KISDI] 텍스트자료를 활용한 ICT이수 탐지 및 분석 방법론 연구 - ICT정책 지원을 위한 빅데이터 분석 및 예측모형 개발 - 심동녘, 정동찬, 노희윤, 이선희*** 문서: ■ 목차 제1장 서 론 제1절 연구의 배경 및 목적 1. 연구의 배경 2. 연구의 목적 제2절 연구의 범위 및 수행 방안 1. 연구의 범위 2. 연구 수행 방안 제2장 경제·사회 분석에서 텍스트자료 활용 사례 제1절 분야별·주제별 사례 분석 제2절 활용목적에 따른 빅데이터 분석 사례 제3장 이머징 이슈 탐색을 위한 텍스트 자료 분석 과정 탐색 제1절 논의 배경 제2절 이머징 이슈 분석을 위한 연구모형 및 연구사례 1. 이머징 이슈 탐색 연구모형 2. 이머징 이슈 탐색 연구사례 제3절 .. 2020. 6. 10.