본문 바로가기
IT 와 Social 이야기

[KCIS 한국신용정보원] 신용정보 표본DB 제공 서비스의 의의 - 김호영 조사역

by manga0713 2018. 5. 4.

 

[개인신용정보 표본DB 제공 범위]

 

 

 

 

*** 출처: [KCIS 한국신용정보원] 신용정보 표본DB 제공 서비스의 의의 - 김호영 조사역

*** 문서:

[이슈2018-7] 신용정보 표본DB 제공 서비스의 의의.pdf

 

 

 

 

■ 개인신용정보 표본DB

 

 

○ 약 5,000여개 금융기관에서 집중되는 개인(이하 차주)의 식별정보, 신용거래정보, 신용도판단정보, 신용능력정보 및 공공정보를 포함하는 일반신용정보를 이용하여 개인신용정보 표본DB를 개발

 

- 일반신용정보 중 최근 3년간 신용거래 경험이 있는 약 3,700만 명의 차주를 모집단으로 선정하고, 층화추출방식으로 약 2% 수준에 해당하는 74만명의 표본을 추출

 

- 차주별 과거 37개월의 대출 및 연체 이력을 연결하여 표본DB를 구성하여, 추출된 차주의 대출 및 연체 정보를 차주중심의 월 단위 시계열 분석이 가능하도록 DB를 구성

 

- 데이터 정합성은 높이면서 오차 범위를 줄이기 위해, 매 분기마다 3개월치의 월별 데이터를 추가하고, 2년을 주기로 전체 표본을 재추출하여 표본DB를 갱신하여 제공할 예정

 

 

 

○ 개인신용정보 표본DB는 현재 차주정보, 대출정보 및 연체정보 등 3개 테이블, 18개 항목으로 개발 되었으며, 단계적으로 세부 항목 및 정보를 확대하여 개인신용정보 표본DB의 활용성을 강화할 예정

 

- (차주정보) 차주의 생년, 성별 등 인구통계 정보

 

- (대출정보) 차주의 대출과 관련된 대출업권 정보, 대출상품 정보, 대출년월 및 대출 금액 등의 정보를 대출기간 동안의 월말시점별 정보를 제공

 

- 대출업권 정보 : 은행, 상호금융, 신용카드사, 생명보험사, 손해보험사, 캐피탈, 상호저축은행 등

 

- 대출상품 정보 : 신용대출, 주택담보대출, 학자금대출, 장기카드대출, 단기카드대출 등

 

- (연체정보) 차주의 연체와 관련된 업권정보, 연체유형 및 사유, 연체등록 사유, 연체 등록일, 연체금액 등 관련 정보를 연체기간 동안의 월말시점별 정보를 제공

 

- 연체유형 및 사유 정보 : 대출금연체, 지급보증대지급, 공공채무불이행, 채무재조정, 공공체납 등

 

 

 

○ 개인신용정보 표본DB는 개인을 식별할 수 없도록 다양한 기법을 적용하여 비식별 조치를 수행하고, 비식별 조치가 적정하게 수행되었는지를 외부 전문 검증단을 통해 검증

 

- (가명처리) 표본DB내 테이블간 결합을 위해 40자리의 임의의 문자열(join key)을 생성. 신용정보원 DB상에서 개별 차주에게 임의로 부여한 ROW ID에 동일한 난수를 더한 뒤 Hash Function으로 변환

 

- (데이터 범주화) 대출일자와 연체등록일자는 년월 단위까지만 제공하고, 대출일자와 연체등록일자가 과거 시점일수록 빈도수가 적어지는 것을 고려하여 일정 기간 이전의 정보는 특정 기준월을 부여

 

--> 대법원을 통해 공고되는 채무재조정정보는 분기 단위까지 제공

 

--> 대출일자는 최초 데이터 제공시점으로부터 20년 전, 연체발생일자는 최초 데이터 제공시점으로 부터 7년 전 시점으로 값 대체

 

- (총계처리) 대출잔액과 연체등록금액은 ①반올림하여 표기하고, ②업권/상품・사유별 금액기준 상위 0.5%를 초과하거나 하위 0.5% 이하인 경우에는 상·하위 0.5% 값을 부여

 

--> 대출잔액은 5억원 이하의 금액은 앞 3자리, 5억 원을 넘는 금액은 앞 2자리만 남기고 반올림, 연체등록금액은 앞 2자리만 남기고 반올림

 

--> 연체등록금액이 여전히 20억원을 초과하는 경우에는 20억원으로 대체

 

- (데이터 삭제) 국세청 국세체납자 명단 등 공개 자료를 통해 재식별될 가능성이 있어, 연체정보 중 공공정보의 연체등록금액은 모두 삭제

 

- (k-익명성 값 검증) 비식별 조치한 이후에도 k=1인 경우가 발생하는 경우에는 가장 가까운 값으로 대체하여 k=3 이상의 빈도수를 유지

 

 

 

 

■ 신용정보 표본DB 제공 방안

 

 

○ 신용정보 표본DB를 안전하게 제공하기 위한 방안과 절차를 마련한 이후 본 서비스 제공

 

- 신용정보원 내에 비식별정보제공심의위원회를 구성·운영하여, 이용자의 표본DB 이용 목적이 통계작성 및 학술연구 목적에 부합하는지 심의를 거친 이후 제공

 

- 이용자의 무분별한 오용을 제한 하기 위해 수혜자 부담 원칙과 실비 부담 원칙에 의거 과금체계를 마련하고 적용할 예정

 

 

○ 이용자에게 데이터를 직접 제공하는 방식은 지양하고, 이용자가 가상의 분석환경 하에서 분석 소프트웨어를 통해 신용정보 표본DB를 분석할 수 있는 원격분석시스템을 구축하여 제공 예정

 

- (서비스포털) 표본DB 소개, 이용신청 접수 및 관리 등 이용자의 분석 서비스 사용을 지원하기 위한 포털시스템 구축

 

- (원격분석시스템) 이용자가 원격분석시스템에서 제공하는 분석도구 등을 이용하여 표본DB를 분석하고 승인절차를 통해 분석결과를 반출할 수 있는 시스템

 

 

 

 

 

[신용정보 표본DB 서비스 개념도]

 

 

 

■ 서비스 제공 시기

 

 

- 2018년 상반기 중 시범서비스를 실시하여 데이터 정합성, 제공 절차 등을 검증하고 보완한 뒤 신용정보 표본DB 서비스를 본격적으로 제공할 계획