- 행렬 : 행과 열을 가지는 2차원 형상을 가진 구조
- 0차원 텐서 : 하나의 실수값으로 이루어진 스칼라값
- 2차원 텐서 : 행과 열이 존재하는 벡터의 배열. 즉, 행렬(matrix)
- 3차원 텐서 : 행렬 또는 2차원 텐서를 단위로 한 번 더 배열한 것
- 텐서 확장 : 3차원 텐서를 배열로 합치면 4차원 텐서, 4차원 텐서를 배열로 합치면 5차원 텐서
○ 시퀀스 데이터(Sequence Data)
- 주로 단어의 시퀀스를 의미, 주로 문장이나 문서, 뉴스 기사 등의 텍스트
- 3D 텐서는 (samples, timestps, word_dim) 또는 (batch_size, timesteps, word_dim)이 됨
- samples / batch_size : 데이터의 개수
- timesteps : 시퀀스의 길이
- word_dim : 단어를 표현하는 벡터의 차원
3. 벡터와 행렬의 연산
'IT 와 Social 이야기 > NLP 자연어처리' 카테고리의 다른 글
[딥러닝을이용한 자연어 처리 입문] 0801 퍼셉트론(Perceptron) (0) | 2021.05.18 |
---|---|
[딥러닝을이용한 자연어 처리 입문] 0709 소프트맥스 회귀(Softmax Regression) - 다중 클래스 분류 (0) | 2021.05.18 |
[딥러닝을이용한 자연어 처리 입문] 0707 다중 입력에 대한 실습 (0) | 2021.05.17 |
[딥러닝을이용한 자연어 처리 입문] 0706 텐서플로우를 사용한 로지스틱 회귀 실습 (0) | 2021.05.17 |
[딥러닝을이용한 자연어 처리 입문] 0704 자동 미분과 선형 회귀 실습 (0) | 2021.05.17 |