Python409 [데이터 사이언스 스쿨] 5.1 시각화 패키지 matplotlib 소개 Matplotlib은 파이썬에서 자료를 차트(chart)나 플롯(plot)으로 시각화하는 패키지이다. ● Figure 객체 모든 그림은 Figure 객체. 정식으로는 matplotlib.figure.Figure 클래스 객체에 포함되어 있다. 내부 플롯(inline plot)이 아닌 경우에는 하나의 Figure는 하나의 아이디 숫자와 윈도우(Window)를 가진다. 주피터 노트북에서는 윈도우 객체가 생성되지 않지만 파이썬을 독립 실행하는 경우에는 하나의 Figure당 하나의 윈도우를 별도로 가진다. figure 명령을 명시적으로 사용하는 경우는 여러개의 윈도우를 동시에 띄워야 하거나(line plot이 아닌 경우), Jupyter 노트북 등에서(line plot의 경우) 그림의 크기를 설정하고 싶을 때이다.. 2021. 4. 28. [데이터 사이언스 스쿨] 4.8 시계열 자료 다루기 ● DatetimeIndex 시계열 자료는 인덱스가 날짜 혹은 시간인 데이터를 말한다. 판다스에서 시계열 자료를 생성하려면 인덱스를 DatetimeIndex 자료형으로 만들어야 한다. DatetimeIndex 인덱스는 다음과 같은 보조 함수를 사용하여 생성한다. pd.to_datetime 함수 pd.date_range 함수 ● shift 인덱스는 그대로 두고 데이터만 이동할 수도 있다. ● resample 시간 간격을 재조정 up-sampling: 시간 구간이 작아지면 데이터 양이 증가 down-sampling: 시간 구간이 커지면 데이터 양이 감소 날짜가 아닌 시/분 단위에서는 구간위 왼쪽 한계값(가장 빠른 값)은 포함하고 오른쪽 한계값(가장 늦은 값)은 포함하지 않는다. 즉, 가장 늦은 값은 다음 구.. 2021. 4. 28. [데이터 사이언스 스쿨] 4.7 피봇테이블과 그룹분석 ● 피봇테이블(pivot table) 데이터 열 중에서 두 개의 열을 각각 행 인덱스, 열 인덱스로 사용하여 데이터를 조회하여 펼쳐놓은 것을 말한다. 판다스는 지정된 두 열을 각각 행 인덱스와 열 인덱스로 바꾼 후 행 인덱스의 라벨 값이 첫번째 키의 값과 같고 열 인덱스의 라벨 값이 두번째 키의 값과 같은 데이터를 찾아서 해당 칸에 넣는다. 만약 주어진 데이터가 존재하지 않으면 해당 칸에 NaN 값을 넣는다. ● 그룹분석 (group analysis) 키가 지정하는 조건에 맞는 데이터가 그룹을 이루는 경우, 미리 지정한 연산을 통해 해당 그룹 데이터의 대표값을 계산한다. - groupby 열 또는 열의 리스트 행 인덱스 size, count: 그룹 데이터의 갯수 mean, median, min, max:.. 2021. 4. 28. [데이터 사이언스 스쿨] 4.6 데이터프레임 합성 ● 데이터프레임 합성 두 개 이상의 데이터프레임을 하나로 합치는 것. 데이터 병합(merge)이나 연결(concatenate) ● Concatenation 기준 열(key column)을 사용하지 않고 단순히 데이터를 연결(concatenate) 기본적으로는 위/아래로 데이터 행을 연결한다. 단순히 두 시리즈나 데이터프레임을 연결하기 때문에 인덱스 값이 중복될 수 있다. - 출처 : [데이터 사이언스 스쿨] 4.6 데이터프레임 합성 2021. 4. 28. 이전 1 ··· 12 13 14 15 16 17 18 ··· 103 다음