본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[딥러닝을이용한 자연어 처리 입문] 0709 소프트맥스 회귀(Softmax Regression) - 다중 클래스 분류

by manga0713 2021. 5. 18.

1. 다중 클래스 분류(Multi-class Classification)

 

- 세 개 이상의 선택지 중 하나를 고르는 문제를 다중 클래스 분류라고 함

- iris(붓꽃)의 품종 분류는 꽃받침 길이, 꽃받침 넓이, 꽃잎 길이, 꽃잎 넓이로부터 setosa, versicolor, virginica라는 3개의 품종 중 어떤 품종인지를 예측하는 문제로 전형적인 다중 클래스 분류 문제 임

 

 

2. 소프트맥스 함수(Softmax function)

 

- 분류해야하는 정답지(클래스)의 총 개수를 k라고 할 때, k차원의 벡터를 입력받아 각 클래스에 대한 확률을 추정 함

- 분류하고자 하는 클래스가 k개일 때, k차원의 벡터를 입력받아서 모든 벡터 원소의 값을 0과 1사이의 값으로 값을 변경하여 다시 k차원의 벡터를 리턴

 

3. 원-핫 벡터의 무작위성

 

- 원-핫 인코딩을 통해 얻은 원-핫 벡터들은 모든 쌍에 대해서 유클리드 거리를 구해도 전부 유클리드 거리가 동일

- 즉 모든 클래스의 관계를 균등하게 분배하므로 순서에 의미가 없고 무작위성이 있는 분류문제에 유용

 

4. 비용 함수(Cost function)

 

- 크로스 엔트로피 함수를 사용

 

5. 소프트맥스 회귀(Softmax Regression) 실습

 

 

nlp_0709_softmax regression.ipynb
0.30MB

 

- 출처 : [딥러닝을이용한 자연어 처리 입문] 0709 소프트맥스 회귀(Softmax Regression) - 다중 클래스 분류