본문 바로가기
IT 와 Social 이야기/NLP 자연어처리

[딥러닝을이용한 자연어 처리 입문] 0708 벡터와 행렬 연산

by manga0713 2021. 5. 18.

1. 벡터와 행렬과 텐서

 

- 벡터 : 크기와 방향을 가진 양

- 행렬 : 행과 열을 가지는 2차원 형상을 가진 구조

- 텐서 : 3차원부터는 주로 텐서라고 부름

 

2. 텐서(Tensor)

 

- 0차원 텐서 : 하나의 실수값으로 이루어진 스칼라값

- 1차원 텐서 : 숫자를 특성 순서대로 배열한 벡터

- 2차원 텐서 : 행과 열이 존재하는 벡터의 배열. 즉, 행렬(matrix)

- 3차원 텐서 : 행렬 또는 2차원 텐서를 단위로 한 번 더 배열한 것

- 텐서 확장 : 3차원 텐서를 배열로 합치면 4차원 텐서, 4차원 텐서를 배열로 합치면 5차원 텐서

 

 

○ 시퀀스 데이터(Sequence Data)

 

- 주로 단어의 시퀀스를 의미, 주로 문장이나 문서, 뉴스 기사 등의 텍스트

- 3D 텐서는 (samples, timestps, word_dim) 또는 (batch_size, timesteps, word_dim)이 됨

  • samples / batch_size : 데이터의 개수
  • timesteps : 시퀀스의 길이
  • word_dim : 단어를 표현하는 벡터의 차원

3. 벡터와 행렬의 연산

 

 

nlp_0708_vector and matrix operation 벡터와 행렬 연산.ipynb
0.01MB

 

- 출처 : [딥러닝을이용한 자연어 처리 입문] 0708 벡터와 행렬 연산