[딥러닝을이용한 자연어 처리 입문] 0805 기울기 소실(Gradient Vanishing)과 폭주(Exploding)를 막는 방법

1. ReLU와 ReLU의 변형들

- Leaky ReLU를 사용하면 모든 입력값에 대해서 기울기가 0에 수렴하지 않아 죽은 ReLU 문제를 해결

- 은닉층에서는 ReLU나 Leaky ReLU와 같은 ReLU 함수의 변형들을 사용

2. 그래디언트 클리핑(Gradient Clipping)

- 기울기 폭주를 막기 위해 임계값을 넘지 않도록 임계치만큼 크기를 감소

3. 가중치 초기화(Weight initialization)

- 가중치가 초기에 어떤 값을 가졌느냐에 따라서 모델의 훈련 결과가 달라지기도 함. 따라서 가중치 초기화만 적절히 해줘도 기울기 소실 문제과 같은 문제를 완화 시킬 수 있음

4. 배치 정규화(Batch Normalization)

- 내부 공변량 변화(Internal Covariate Shift)

- 배치 정규화(Batch Normalization)

- 배치 정규화의 한계

5. 층 정규화(Layer Normalization)

[딥러닝을이용한 자연어 처리 입문] 0807 케라스의 함수형 API(Keras Functional API) (0)	2021.05.19
[딥러닝을이용한 자연어 처리 입문] 0806 케라스(Keras) 훑어보기 (0)	2021.05.18
[딥러닝을이용한 자연어 처리 입문] 0804 과적합(Overfitting)을 막는 방법들 (0)	2021.05.18
[딥러닝을이용한 자연어 처리 입문] 0803 딥 러닝의 학습 방법 (0)	2021.05.18
[딥러닝을이용한 자연어 처리 입문] 0802 인공 신경망(Artificial Neural Network) 훑어보기 (0)	2021.05.18

망가천재의 스토리텔링