● 선형대수(linear algebra)에서 다루는 데이터 유형
- 스칼라(scalar) : 숫자 하나로 이루어진 데이터
- 벡터(vector) : 여러 숫자로 이루어진 데이터 레코드(data record), 열 벡터(column vector)
- 행렬(matrix) : 벡터, 즉 데이터 레코드가 여럿인 데이터 집합
- 텐서(tensor) : 같은 크기의 행렬이 여러 개 있는 것
● 특징 벡터(feature vector)
데이터 벡터가 예측 문제에서 입력 데이터로 사용되면 특징 벡터(feature vector)라고 한다.
● Numpy를 사용한 벡터 표현
열의 개수가 하나인 2차원 배열(array) 객체로 표현한다.
● 행렬(Matrix)
붓 꽃 한 송이는 4개의 값, 열 벡터 이므로 6 송이에 대한 벡터를 살펴보면, 4 x 6 =24개의 실수 숫자가 다음 그림과 같이 채워진 행렬이 된다.
하나의 데이터 레코드를 단독으로 벡터로 나타낼 때는 하나의 열(column)로 표기하고 복수의 데이터 레코드 집합을 행렬로 나타낼 때는 하나의 데이터 레코드를 하나의 행(row)으로 표기 한다.
● 텐서(Tensor)
● 전치 연산(Transpose)
행렬의 행과 열을 바꾸는 연산
● 정방행렬(Square matrix)
행과 열의 개수가 같은 행렬
● 대각행렬(Diagonal matrix)
모든 비대각 요소가 0인 행렬. 대각행렬이 되려면 비대각성분이 0이기만 하면 되고 대각성분은 0이든 아니든 상관없다. 또한 반드시 정방행렬일 필요도 없다.
● 항등행렬(Identity matrix)
대각행렬 중 모든 대각성분의 값이 1인 대각행렬
● 대칭행렬(Symmetric matrix)
전치연산을 통해 얻은 전치행렬과 원래의 행렬이 같은 행렬. 정방행렬만 대칭행렬이 될 수 있다.
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] math 3.1 선형대수와 해석기하의 기초 (0) | 2021.04.30 |
---|---|
[데이터 사이언스 스쿨] math 2.2 벡터와 행렬의 연산 (0) | 2021.04.30 |
[데이터 사이언스 스쿨] 5.5 Pandas의 시각화 기능 (0) | 2021.04.29 |
[데이터 사이언스 스쿨] 5.4 Seaborn을 사용한 데이터 분포 시각화 (0) | 2021.04.29 |
[데이터 사이언스 스쿨] 5.3 matplotlib 의 triangular grid 사용법 (0) | 2021.04.29 |