본문 바로가기
IT 와 Social 이야기/Python

[데이터 사이언스 스쿨] 4.8 시계열 자료 다루기

by manga0713 2021. 4. 28.

DatetimeIndex

 

시계열 자료는 인덱스가 날짜 혹은 시간인 데이터를 말한다. 판다스에서 시계열 자료를 생성하려면 인덱스를 DatetimeIndex 자료형으로 만들어야 한다.

 

DatetimeIndex 인덱스는 다음과 같은 보조 함수를 사용하여 생성한다.

 

 

 

● shift

 

인덱스는 그대로 두고 데이터만 이동할 수도 있다.

 

 

● resample

 

시간 간격을 재조정

 

up-sampling: 시간 구간이 작아지면 데이터 양이 증가

down-sampling: 시간 구간이 커지면 데이터 양이 감소

 

날짜가 아닌 시/분 단위에서는 구간위 왼쪽 한계값(가장 빠른 값)은 포함하고 오른쪽 한계값(가장 늦은 값)은 포함하지 않는다. 즉, 가장 늦은 값은 다음 구간에 포함된다. 예를 들어 10분 간격으로 구간을 만들면 10의 배수가 되는 시각은 구간의 시작점이 된다.

 

 

왼쪽이 아니라 오른쪽 한계값을 구간에 포함하려면 closed="right" 인수를 사용한다. 이 때는 10의 배수가 되는 시각이 앞 구간에 포함된다.

 

업-샘플링의 경우에는 실제로 존재하지 않는 데이터를 만들어야 한다.

 

ffill: 앞에서 나온 데이터를 뒤에서 그대로 쓰는 forward filling 방식

bfill: 뒤에서 나올 데이터를 앞에서 미리 쓰는 backward filling 방식

 

 

 

● dt 접근자

 

 

dss4_8_time series data.ipynb
0.03MB

 

 

 

- 출처: [데이터 사이언스 스쿨] 4.8 시계열 자료 다루기