본문 바로가기

자연어 처리116

[딥러닝을이용한 자연어 처리 입문] 1106 네이버 영화 리뷰 감성 분류하기(Naver Movie Review Sentiment Analysis) - 대상 데이터 : 총 200,000개 리뷰와 리뷰가 긍정인 경우 1을 부정인 경우 0으로 표시한 레이블로 구성 - 분류모델 : LSTM - 다운로드 링크 : https://github.com/e9t/nsmc/ - 출처 : [딥러닝을이용한 자연어 처리 입문] 1106 네이버 영화 리뷰 감성 분류하기(Naver Movie Review Sentiment Analysis) 2021. 5. 25.
[딥러닝을이용한 자연어 처리 입문] 1105 나이브 베이즈 분류기(Naive Bayes Classifier) - 나이브 베이즈 분류기에 입력 텍스트로 메일의 본문이 주어졌을 때, 입력 텍스트가 정상 메일인지 스팸 메일인지 구분하기 위한 확률을 아래와 같이 표현할 수 있음 P(정상 메일 | 입력 텍스트) = 입력 텍스트가 있을 때 정상 메일일 확률 P(스팸 메일 | 입력 텍스트) = 입력 텍스트가 있을 때 스팸 메일일 확률 - 이를 베이즈의 정리에 따라서 식을 표현하면 P(정상 메일 | 입력 텍스트) = (P(입력 텍스트 | 정상 메일) × P(정상 메일)) / P(입력 텍스트) P(스팸 메일 | 입력 텍스트) = (P(입력 텍스트 | 스팸 메일) × P(스팸 메일)) / P(입력 텍스트) - 식을 간소화하면 P(정상 메일 | 입력 텍스트) = P(입력 텍스트 | 정상 메일) × P(정상 메일) P(스팸 메일 |.. 2021. 5. 25.
[딥러닝을이용한 자연어 처리 입문] 1104 IMDB 리뷰 감성 분류하기(IMDB Movie Review Sentiment Analysis) - 대상 데이터 : IMDB 리뷰 데이터는 리뷰에 대한 텍스트와 해당 리뷰가 긍정인 경우 1을 부정인 경우 0으로 표시한 레이블로 구성(훈련 데이터 : 테스트 데이터, 50 : 50) - 언어 모델 : GRU(Gated Recurrent Unit) - 출처 : [딥러닝을이용한 자연어 처리 입문] 1104 IMDB 리뷰 감성 분류하기(IMDB Movie Review Sentiment Analysis) 2021. 5. 25.
[딥러닝을이용한 자연어 처리 입문] 1103 로이터 뉴스 분류하기(Reuters News Classification) - 데이터 : 로이터 뉴스 기사 데이터 (총 11,258개 ,46개 뉴스 카테고리) - 분류모델 : LSTM - 출처 : [딥러닝을이용한 자연어 처리 입문] 1103 로이터 뉴스 분류하기(Reuters News Classification) 2021. 5. 24.