넘파이9 [데이터 사이언스 스쿨] 3.5 난수 발생과 카운팅 ● 시드(seed) 설정하기 시드는 보통 현재 시각등을 이용하여 자동으로 정해지지만 사람이 수동으로 설정할 수도 있다. 특정한 시드값이 사용되면 그 다음에 만들어지는 난수들은 모두 예측할 수 있다. 인수로는 0과 같거나 큰 정수를 넣어준다. ● 데이터 샘플링(sampling): 표본 선택 이미 있는 데이터 집합에서 일부를 무작위로 선택하는 것 numpy.random.choice(a, size=None, replace=True, p=None) a : 배열이면 원래의 데이터, 정수이면 arange(a) 명령으로 데이터 생성 size : 정수. 샘플 숫자 replace : 불리언. True이면 한번 선택한 데이터를 다시 선택 가능 p : 배열. 각 데이터가 선택될 수 있는 확률 ★★★ unique 함수는 데이.. 2021. 4. 26. [데이터 사이언스 스쿨] 3.4 기술 통계 ● 기술 통계(descriptive statistics) 표준 편차(standard deviation) 최댓값(maximum) 최솟값(minimum) 중앙값(median) 사분위수(quartile) - 출처: [데이터 사이언스 스쿨] 3.4 기술 통계 2021. 4. 26. [데이터 사이언스 스쿨] 3.3 배열의 연산 ● 벡터화 연산(vectorized operation) 벡터화 연산을 쓰면 명시적으로 반복문을 사용하지 않고도 배열의 모든 원소에 대해 반복연산을 할 수 있다. 벡터화 연산의 또다른 장점은 선형 대수 공식과 동일한 아주 간단한 파이썬 코드를 작성할 수 있다는 점이다. ● 스칼라와 벡터/행렬의 곱셈 ● 브로드캐스팅 벡터(또는 행렬)끼리 덧셈 혹은 뺄셈을 하려면 두 벡터(또는 행렬)의 크기가 같아야 한다. 넘파이에서는 서로 다른 크기를 가진 두 배열의 사칙 연산도 지원한다. 이 기능을 브로드캐스팅(broadcasting)이라고 하는데 크기가 작은 배열을 자동으로 반복 확장하여 크기가 큰 배열에 맞추는 방법이다. - 스칼라 스칼라는 크기. 사과 1개, 사람 1명, 속력 ~얼마와 같은 값들. 즉, 방향성이 없는.. 2021. 4. 26. [데이터 사이언스 스쿨] 3.2 배열의 생성과 변형 ● 넘파이의 자료형 넘파이의 배열 즉, ndarray클래스는 원소가 모두 같은 자료형이어야 한다. ● Inf 와 NaN 무한대를 표현하기 위한 np.inf(infinity), 정의할 수 없는 숫자를 나타내는 np.nan(not a number) ● 배열 생성 및 초기화 zeros, ones zeros_like, ones_like empty arange linspace, logspace ● 전치연산(transpose) 2차원 배열의 행과 열을 바꾸는 작업 ● 배열의 크기 변형 배열 사용에서 주의할 점은 길이가 5인 1차원 배열과 행, 열의 갯수가 (5,1)인 2차원 배열 또는 행, 열의 갯수가 (1, 5)인 2차원 배열은 데이터가 같아도 엄연히 다른 객체라는 점이다. ● 배열 연결(concatenate) .. 2021. 4. 23. 이전 1 2 3 다음