시계열 자료는 인덱스가 날짜 혹은 시간인 데이터를 말한다. 판다스에서 시계열 자료를 생성하려면 인덱스를 DatetimeIndex 자료형으로 만들어야 한다.
DatetimeIndex 인덱스는 다음과 같은 보조 함수를 사용하여 생성한다.
● shift
인덱스는 그대로 두고 데이터만 이동할 수도 있다.
● resample
시간 간격을 재조정
up-sampling: 시간 구간이 작아지면 데이터 양이 증가
down-sampling: 시간 구간이 커지면 데이터 양이 감소
날짜가 아닌 시/분 단위에서는 구간위 왼쪽 한계값(가장 빠른 값)은 포함하고 오른쪽 한계값(가장 늦은 값)은 포함하지 않는다. 즉, 가장 늦은 값은 다음 구간에 포함된다. 예를 들어 10분 간격으로 구간을 만들면 10의 배수가 되는 시각은 구간의 시작점이 된다.
왼쪽이 아니라 오른쪽 한계값을 구간에 포함하려면 closed="right" 인수를 사용한다. 이 때는 10의 배수가 되는 시각이 앞 구간에 포함된다.
업-샘플링의 경우에는 실제로 존재하지 않는 데이터를 만들어야 한다.
ffill: 앞에서 나온 데이터를 뒤에서 그대로 쓰는 forward filling 방식
bfill: 뒤에서 나올 데이터를 앞에서 미리 쓰는 backward filling 방식
● dt 접근자
'IT 와 Social 이야기 > Python' 카테고리의 다른 글
[데이터 사이언스 스쿨] 5.2 matplotlib 의 여러가지 플롯 (0) | 2021.04.29 |
---|---|
[데이터 사이언스 스쿨] 5.1 시각화 패키지 matplotlib 소개 (0) | 2021.04.28 |
[데이터 사이언스 스쿨] 4.7 피봇테이블과 그룹분석 (0) | 2021.04.28 |
[데이터 사이언스 스쿨] 4.6 데이터프레임 합성 (0) | 2021.04.28 |
[데이터 사이언스 스쿨] 4.5 데이터프레임 인덱스 조작 (0) | 2021.04.28 |