본문 바로가기

dataframe8

[데이터 사이언스 스쿨] 4.4 데이터프레임의 데이터 조작 판다스는 넘파이 2차원 배열에서 가능한 대부분의 데이터 처리가 가능하며 추가로 데이터 처리 및 변환을 위한 다양한 함수와 메서드를 제공한다. ● 카테고리 값 세기 시리즈의 값이 정수, 문자열, 카테고리 값인 경우에는 value_counts 메서드로 각각의 값이 나온 횟수를 셀 수 있다. ● 정렬 sort_index 메서드는 인덱스 값을 기준으로, sort_values 메서드는 데이터 값을 기준으로 정렬한다. ● 행/열 합계 sum(axis) 메서드 사용. axis 인수에는 방향축(0=행, 1=열)을 지정한다. ● apply 변환 행이나 열 단위로 더 복잡한 처리를 하고 싶을 때는 apply 메서드를 사용한다. ● fillna : NaN 값을 원하는 값으로 변경 ● astype : 전체 데이터의 자료형 변.. 2021. 4. 27.
[데이터 사이언스 스쿨] 4.3 데이터프레임 고급 인덱싱 데이터프레임에서 특정한 데이터만 골라내는 것을 인덱싱(indexing)이라고 한다. Pandas는 numpy행렬과 같이 쉼표를 사용한 (행 인덱스, 열 인덱스) 형식의 2차원 인덱싱을 지원한다. loc : 라벨값 기반의 2차원 인덱싱 : df.loc[행 인덱싱값] 또는 df.loc[행 인덱싱값, 열 인덱싱값] iloc : 순서를 나타내는 정수 기반의 2차원 인덱싱 : df.iloc[행 인덱싱값, 열 인덱싱값] ★★★ loc 인덱서가 없는 경우에 사용했던 라벨 인덱싱이나 라벨 리스트 인덱싱은 불가능하다. ● iloc 순서를 나타내는 정수(integer) 인덱스만 받는다. - 출처: [데이터 사이언스 스쿨] 4.3 데이터프레임 고급 인덱싱 2021. 4. 27.
[데이터 사이언스 스쿨] 4.2 판다스 데이터 입출력 ● Pandas는 데이터 파일을 읽어 데이터프레임을 만들 수 있다. 위 이미지와 같이 여러가지 포맷을 지원한다. ● CSV 파일 pandas.read_csv ● 데이터프레임 값을 CSV 파일로 출력할 때 to_csv ● 인터넷 상의 CSV 파일 입력 파일 패스 대신 URL을 지정 ● 인터넷 상의 데이터베이스 입력 pandas_datareader 패키지의 DataReader 을 사용하면 일부 인터넷 사이트의 자료를 바로 pandas로 읽어들일 수 있다. 그 외는 잘 찾아 데이터의 사용법대로 읽어오면 된다. - 출처: [데이터 사이언스 스쿨] 4.2 판다스 데이터 입출력 2021. 4. 27.
[edwith] 인공지능 코딩을 위한 실용 파이썬 - w10: Pandas 사용법 익히기-권영선교수 [LECTURE] 10-1 pandas Series와 DataFrame 만들기 및 index 설정 : edwith 9주차 수업을 수강하시느라 고생 많으셨습니다. 10주차 1차시 수업에서는 pandas의 series와 dataframe 만들기 및 index 설정에 대해 학습해 봅니다. - AssistSong www.edwith.org [LECTURE] 10-2 pandas DataFrame 잘라내기 (slicing) : edwith 10주차 2차시 수업에서는 pandas의 dataframe 잘라내기에 대해 학습해 봅니다. - AssistSong www.edwith.org [LECTURE] 10-3 pandas descriptive statistics, transposing, sorting : edwith .. 2021. 4. 20.