본문 바로가기

배열10

[데이터 사이언스 스쿨] 3.4 기술 통계 ● 기술 통계(descriptive statistics) 표준 편차(standard deviation) 최댓값(maximum) 최솟값(minimum) 중앙값(median) 사분위수(quartile) - 출처: [데이터 사이언스 스쿨] 3.4 기술 통계 2021. 4. 26.
[데이터 사이언스 스쿨] 3.3 배열의 연산 ● 벡터화 연산(vectorized operation) 벡터화 연산을 쓰면 명시적으로 반복문을 사용하지 않고도 배열의 모든 원소에 대해 반복연산을 할 수 있다. 벡터화 연산의 또다른 장점은 선형 대수 공식과 동일한 아주 간단한 파이썬 코드를 작성할 수 있다는 점이다. ● 스칼라와 벡터/행렬의 곱셈 ● 브로드캐스팅 벡터(또는 행렬)끼리 덧셈 혹은 뺄셈을 하려면 두 벡터(또는 행렬)의 크기가 같아야 한다. 넘파이에서는 서로 다른 크기를 가진 두 배열의 사칙 연산도 지원한다. 이 기능을 브로드캐스팅(broadcasting)이라고 하는데 크기가 작은 배열을 자동으로 반복 확장하여 크기가 큰 배열에 맞추는 방법이다. - 스칼라 스칼라는 크기. 사과 1개, 사람 1명, 속력 ~얼마와 같은 값들. 즉, 방향성이 없는.. 2021. 4. 26.
[데이터 사이언스 스쿨] 3.2 배열의 생성과 변형 ● 넘파이의 자료형 넘파이의 배열 즉, ndarray클래스는 원소가 모두 같은 자료형이어야 한다. ● Inf 와 NaN 무한대를 표현하기 위한 np.inf(infinity), 정의할 수 없는 숫자를 나타내는 np.nan(not a number) ● 배열 생성 및 초기화 zeros, ones zeros_like, ones_like empty arange linspace, logspace ● 전치연산(transpose) 2차원 배열의 행과 열을 바꾸는 작업 ● 배열의 크기 변형 배열 사용에서 주의할 점은 길이가 5인 1차원 배열과 행, 열의 갯수가 (5,1)인 2차원 배열 또는 행, 열의 갯수가 (1, 5)인 2차원 배열은 데이터가 같아도 엄연히 다른 객체라는 점이다. ● 배열 연결(concatenate) .. 2021. 4. 23.
[데이터 사이언스 스쿨] 3.1 넘파이 배열 많은 숫자 데이터를 하나의 변수에 넣고 관리 할 때 리스트는 속도가 느리고 메모리를 많이 차지하는 단점이 있다. 배열(array)을 사용하면 적은 메모리로 많은 데이터를 빠르게 처리할 수 있다. 배열은 리스트와 비슷하지만 다음과 같은 점에서 다르다. 모든 원소가 같은 자료형이어야 한다. 원소의 갯수를 바꿀 수 없다. 파이썬은 자체적으로 배열 자료형을 제공하지 않는다. 따라서 배열을 구현한 다른 패키지를 임포트해야 한다. 파이썬에서 배열을 사용하기 위한 표준 패키지는 넘파이(NumPy)다. ● 1차원 배열 만들기 ● 벡터화 연산 ● 2차원 배열 만들기 2차원 배열은 행렬(matrix)이라고 하는데 행렬에서는 가로줄을 행(row)이라고 하고 세로줄을 열(column)이라고 부른다. 리스트의 리스트(list .. 2021. 4. 23.