1. PyKoSpacing
전희원님이 개발한 PyKoSpacing은 한국어 띄어쓰기 패키지로 띄어쓰기가 되어있지 않은 문장을 띄어쓰기를 한 문장으로 변환해주는 패키지입니다.
2. Py-Hanspell
네이버 한글 맞춤법 검사기를 바탕으로 만들어진 패키지입니다.
3. SOYNLP를 이용한 단어 토큰화
soynlp는 품사 태깅, 단어 토큰화 등을 지원하는 단어 토크나이저입니다.
4. Customized KoNLPy
사용자 사전 추가가 매우 쉬운 패키지 입니다.
- 출처 : [딥러닝을이용한 자연어 처리 입문] 0210 한국어 전처리 패키지 Text Preprocessing Tools for Korean Text
'IT 와 Social 이야기 > NLP 자연어처리' 카테고리의 다른 글
[딥러닝을이용한 자연어 처리 입문] 0402 Bag of Words(BoW) (0) | 2021.05.16 |
---|---|
[딥러닝을이용한 자연어 처리 입문] 0301 언어 모델 Language Model이란? (0) | 2021.05.16 |
[딥러닝을이용한 자연어 처리 입문] 0209 데이터의 분리 Splitting Data (0) | 2021.05.16 |
[딥러닝을이용한 자연어 처리 입문] 0208 원-핫 인코딩 One-Hot Encoding (0) | 2021.05.16 |
[딥러닝을이용한 자연어 처리 입문] 0207 패딩 Padding (0) | 2021.05.16 |