본문 바로가기
IT 와 Social 이야기

[NIA] 카드 소비 빅데이터를 활용한 경기 선행지표 발굴

by manga0713 2018. 2. 12.

[다양한 해외 선행지표]

 

 

 

 

*** 출처: [NIA] 카드 소비 빅데이터를 활용한 경기 선행지표 발굴

*** 문서:

NF_INSIGHT_Vol7_카드소비빅데이터를활용한경기선행지표발굴.pdf

 

 

 

 

■ 과제개요

 

 

○ 과제명 : 빅데이터를 활용한 경기 선행지표 발굴

 

○ 수행기간 : 2017년 6월 ~ 11월

 

○ 주요 내용 : 국내 경제 이슈에 대한 금융정책의 적시성 제고를 위해 카드 빅데이터를 활용하여 예측력 높은 경기 선행지표 개발 및 일반국민의 경기흐름 이해도 향상을 위한 계층별 실물경제 선행지표 발굴

 

○ 활용 데이터 : ① 신한카드 빅데이터 , ② 공공지표 : 소매판매액, 소비자심리지수

 

○ 수행기관 : 신한카드(주관기관), 홍익대학교 산학협력단(위탁기관)

 

 

 

■ 추진배경

 

 

○ 국내·외 다양한 경제 이슈로 인한 변동성 확대 등 금융정책을 통한 선제적 리스크 대처 필요

 

○ 빅데이터를 활용한 국가통계 고도화로 선제적 대응체계 마련 시급

 

○ 경제이슈 선제대응을 위한 빅데이터 경기예측지표 발굴 필요

 

○ 높은 경기 예측력과 더불어 국민체감형 실물경기 선행지표 개발 요구

 

 

 

■ 과제범위

 

 

○ 예측력 높은 빅데이터 선행지표 및 계층별 실물경기 선행지표 추가 발굴

 

- 본 과제에서는 속보성 있는(실시간 분석이 가능한) 빅데이터를 활용하여 정량적인 선행지표 개발을 진행하였으며, 그 방식은 다음과 같이 두 가지로 추진함

 

 

① 카드 데이터의 특성을 살려 실물소비를 대변할 수 있는 다양한 계층별 직관적인 ‘개별 선행 지표’ 도출

 

② 계층별 선행지표의 적합성 판단 결과 기존 선행지표의 예측력 향상을 보완하는 선행지표들을 조합하여 ‘빅데이터 종합선행지수’ 개발

 

 

- 또한, 빅데이터를 활용한 선행지표 개발 알고리즘 및 선행지표에 대한 평가 방법론을 도출하였음

 

 

 

 

 

 

■ 개발내용

 

 

1. 선행지표 후보군 분석마트 구축

 

■ 다양한 계층의 빅데이터 선행지표 구축을 위해 소비자와 가맹점 특성별 여러 차원의 데이터를 조합한 분석용 마트 구축

 

○ 분석 DB의 구성을 크게 소비자 특성과 가맹점 특성으로 나누어 계층 관련 데이터를 구성 하였으며, 소비자 특성은 기본적인 인구 특성과 함께 경제생활에 영향을 미치는 소득 수준과 부채규모 등을 반영하였고, 가맹점 특성은 가맹점 매출규모, 평균 객단가, 이용 시간대, 프랜차이즈 여부 등으로 구성하였음

 

○ 이렇게 구성된 소비자 및 가맹점 특성별로 계층을 정의하고, 구성된 계층별로 소비업종에 따른 매출 관련 지표(매출액, 매출건수, 이용고객수, 객단가, 업종내 매출비중 등)로 다양한 관점의 데이터 마트를 구축함

 

- 가맹점 정보: 개폐업 정보, 가맹점 규모, 프랜차이즈 여부, 평균 객단가

 

- 라이프 스타일: 특정업종의 이용요일, 이용시간대, 건당금액

 

- 업종별 매출: 여행, 문화공연, 스포츠, 면세점, 골프, 요식업, 커피전문점, 베이커리, 가전 가구, 주유금액, 안경매장, 택시, 유흥업종, 미용 관련, 마트, 통신요금, 생명 보험 등 240여개 업종별 이용금액, 이용건수

 

- 시계열의 산출 기간은 2008.1월부터 2017.9월까지로 구성

 

 

 

[빅데이터 선행지표 개발 프로세스]

 

 

[선행지표 후보군 분석마트 구축]

 

 

 

3. 빅데이터 선행지표 개발 방법론 도출

 

 

○ 빅데이터 선행지표의 채택 기준은 기존 선행지표인 한국은행의 소비자 심리지수의 성능 평가와 유사한 방법으로 신규 선행지표가 추가될 경우 실물소비의 예측모형이 통계적으로 유의미한 설명력을 가질 때 채택함 (기존 지표와 동일 모형을 사용하므로 3개월 선행시차를 보임)

 

 

절차 ① : 실물경기에 선행하는 업종 및 산업 1차 검토

 

- 1차 데이터 탐색 방법으로 업종 및 가맹점별 카드승인액 데이터와 최종 총 소비액(통계청 소매판매액, 신용카드 승인액)의 추세분석을 진행하였음. 최종 총 소비액 변화 시 선행적으로 변화 하는 업종 및 산업을 파악하여 초기 선행 후보 요인군을 식별하였고, 1) 추세분석과 함께 경기변동이 가장 큰 시점에 대한 2) 증감률 비교분석방법도 사용하였음

 

 

절차 ② : 통계 분석을 통한 경기변동 선행요인 도출

 

- 1차 데이터 탐색을 통해 식별된 초기 선행 후보 요인군을 분석하여 유의미한 업종 및 가맹점 정보에 대해 인구통계 특성과 소득, 부채수준 등의 계층을 세분화하였으며,

 

- 2차 분석에 필요한 다양한 선행지표 후보군을 도출함. 도출된 선행지표에 대한 시계열 데이터 분석 및 거시경제지표 변화율 추정에 흔히 사용되는 로그차분 성장률 모형(Log Difference Growth Model)을 적용하여 보다 정밀한 2차 분석을 시행함으로써 카드 빅데이터에 기반한 경기 (소비지출) 변동 선행요인을 도출하였음

 

 

절차 ③ : 카드 빅데이터 신규 선행지표 발굴

 

- 앞서 발굴된 카드 빅데이터에 기반한 경기(소비지출) 변동 선행요인 중 설명력이 높은 요인을 조합한 종합선행지수를 개발하여 좀 더 높은 설명력(performance)를 갖는 선행지표를 발굴하였으며, 선행요인을 조합하는 방법에는 확정요인분석(Confirmatory Factor Analysis) 방법론을 활용함

 

 

 

4. 빅데이터를 활용한 신규 선행지표 발굴 결과

 

 

1) 분석항목별 신규 선행지표 발굴 결과

 

 

○ 분석항목별 분석결과 : 신규 개업과 관련된 지표, 주유 5만원 이하 비중, 면세점, 전자 등의 선택적 소비 관련 업종 매출 지표가 선행지표로서 적합한 것으로 판단되었으며, 이러한 지표가 변화하면 3개월 후의 경기가 변동하는 것을 의미

 

 

2) 계층별 신규 선행지표 발굴 결과

 

 

○ 계층별 분석결과 : 계층별(연령별, 가맹점특성 등) 유의미한 선행지표 도출 결과, 청소년의 공연장, 놀이공원 소비가 늘어나면 경기가 좋아지고, 보건소, 종교단체 소비가 늘어나면 경기가 나빠지는 등 계층별로 차별화된 주요 선행 지표가 도출됨

 

 

 

[신규 지표 후보 변수의 소비 지출에 대한 추가 설명력]