본문 바로가기
IT 와 Social 이야기

[공공데이터포털] 공공 빅데이터 표준분석모델 매뉴얼 - 민원분야

by manga0713 2017. 8. 28.

 

 

 

 

■ 목차

 

 

1. 표준분석모델......................................................................1
1.1 개요..........................................................................1
1.1.1 표준분석모델의 필요성..................................................1
1.1.2 표준분석모델의 개념.....................................................1
1) 표준분석모델 정의..................................................................1
2) 표준분석모델 구조..................................................................2

2. 민원 표준분석모델..............................................................3
2.1 표준화 대상................................................................3
2.2 분석 기법...................................................................5
2.3 활용 데이터................................................................9
2.3.1 새올 민원.....................................................................9
1) 민원 정보...............................................................................9
2) 법정동 정보............................................................................11
3) 행정동&법정동 인구 정보.........................................................12
4) 주소 정보 매핑 데이터.............................................................13
5) 부서 정보 매핑 데이터.............................................................14
2.3.2 바란다 민원..................................................................15
2.3.3 콜센터 민원..................................................................16
2.3.4 칭찬 민원.....................................................................17
2.4 분석 프로세스 ............................................................18
2.4.1 새올 및 바란다 민원 분석 프로세스..................................18
1) 분석 프로세스.........................................................................18
2) 분석 프로세스 상세.................................................................19

2.4.2 칭찬 민원 분석 프로세스................................................20
1) 분석 프로세스.........................................................................21
2) 분석 프로세스 상세.................................................................21
2.4.3 콜센터 민원 분석 프로세스.............................................22
1) 분석 프로세스.........................................................................23
2) 분석 프로세스 상세.................................................................23
2.5 분석 프로그램 설치 .....................................................25
2.5.1 Java 설치.....................................................................25
1) Java 설치...............................................................................25
2) Java 설치 위치 변경한 경우......................................................26
2.5.2 R 설치 ........................................................................29
2.5.3 R Studio 설치 .............................................................34
2.5.4 R Packages 설치 .........................................................38

3. R을 이용한 민원 분석..........................................................39
3.1 분석 환경 설정............................................................39
3.1.1 PC 환경 설정................................................................39
1) 분석 폴더 생성........................................................................39
2) 생성 폴더 정의........................................................................40
3) 분석 파일 정의........................................................................41
3.2 새올 민원 분석............................................................42
3.2.1 R 함수 불러오기...........................................................42
1) 새올민원.R 파일 불러오기........................................................42
2) “R 함수 불러오기” 실행...........................................................44
3.2.2 데이터 불러오기 및 정제................................................45
1) 데이터 위치 정의.....................................................................45
2) 데이터 불러오기 및 정제 수행1.................................................46

3) 주소 및 부서 매핑....................................................................48
4) 데이터 불러오기 및 정제 수행2.................................................50
3.2.3 데이터 전처리..............................................................51
3.2.4 현황분석......................................................................53
3.2.5 소셜 네트워크 분석.......................................................55
1) SNA 실행하기........................................................................55
2) 주요현안 도출.........................................................................57
3.2.6 특정 키워드 분석..........................................................58
1) 탐색적 데이터 분석.................................................................58
2) 키워드 연관성 분석.................................................................60
3) Topic Modeling.....................................................................62
3.2.7 민원처리 프로세스 분석.................................................70
1) 부서별 민원처리 현황 분석.......................................................70
2) 담당자 지정시간 분석..............................................................72
3) 처리시간 분석.........................................................................73
4) 연장처리시간 분석..................................................................75
3.2.8 시각화 데이터 생성.......................................................76
3.3 바란다 민원 분석.........................................................83
3.3.1 R 함수 불러오기.......................................................83
3.3.2 주요 현안 도출.........................................................83
1) “04. 소셜 네트워크 분석” 까지 실행하기.....................................83
2) 주요현안 도출.........................................................................86
3.3.3 특정 키워드 분석..........................................................87
3.3.4 시각화 데이터 생성.......................................................87
3.4 콜센터 민원 분석........................................................93
3.4.1 R 함수 불러오기...........................................................93

3.4.2 민원 현황분석 실행하기.................................................93
3.4.3 소셜 네트워크 분석.......................................................95
3.4.4 연관성 분석..................................................................98
3.4.5 시각화 데이터 생성.......................................................100
3.5 칭찬 민원 분석............................................................102
3.5.1 R 함수 불러오기...........................................................102
3.5.2 민원 현황분석 실행하기.................................................102
3.5.3 대상별 현황분석...........................................................105
3.5.4 키워드 분석..................................................................107
3.5.5 대상별 키워드 분석.......................................................108
3.5.6 시각화 데이터 생성.......................................................110

4. SRA를 이용한 민원 분석.....................................................112
4.1 새올 민원 분석............................................................112
4.1.1 분석 환경 설정..............................................................112
4.1.2 01-1. Load Data..........................................................114
1) Loading File..........................................................................114
2) 날짜타입 변환.........................................................................116
3) 분석프로세스 컬럼 추가...........................................................117
4) 법정동 주소 정보.....................................................................118
5) 민원내용에서 주소 추출...........................................................123
6) 도로명 주소 변경 정보.............................................................124
7) 도로명 주소를 법정동 주소로 변경.............................................128
8) 민원 주소 테이블.....................................................................130
9) 주소 정보 저장........................................................................130
10) 처리부서 테이블....................................................................131
11) 처리부서 정보 저장................................................................132

4.1.3 01-2. Mapping............................................................134
1) Workflow 선택.......................................................................134
2) Loading File..........................................................................134
3) 주소 매핑 정보 다운로드..........................................................136
4) 주소 매핑 정보 업로드.............................................................138
5) 주소 매핑 정보........................................................................141
6) 주소 매핑...............................................................................142
7) 처리부서 매핑 정보 다운로드....................................................143
8) 처리부서 매핑 정보 업로드.......................................................145
9) 처리부서 매핑 정보.................................................................147
10) 처리부서 매핑.......................................................................149
4.1.4 02. Preprocessing.......................................................150
1) Workflow 선택.......................................................................151
2) Loading File..........................................................................151
3) 기간 추가...............................................................................153
4) 전체 데이터............................................................................154
5) 모바일 데이터.........................................................................155
6) 온라인 데이터.........................................................................156
7) Top1 지역 데이터...................................................................157
8) Top2 지역 데이터...................................................................158
9) Top3 지역 데이터...................................................................159
10) 연도별 데이터(전체)...............................................................160
11) 연도별-월별 데이터(전체).......................................................161
12) NLP Tagger(전체-연도별)......................................................162
13) 단어 길이 컬럼 생성...............................................................165
14) 불필요 단어 및 길이 1 제거.....................................................166
15) 명사형 단어 추출...................................................................167
16) 민원 건별 단어셋 생성............................................................168
17) 문서-단어 행렬(DTM)............................................................169
18) 모바일/온라인/지역에 대한 기간별 데이터...............................170

4.1.5 03. EDA......................................................................171
1) 기간별 전체민원 건수..............................................................171
2) 시각화...................................................................................172
3) 단어-단어 행렬.......................................................................173
4) 워드클라우드 및 단어 빈도표....................................................173
5) 분석 데이터 저장.....................................................................175
6) 모바일/온라인/지역에 대한 기간별 데이터.................................176
4.1.6 04. SNA......................................................................176
1) Workflow 선택.......................................................................176
2) 문서-단어 행렬 불러오기..........................................................177
3) SNA 분석..............................................................................178
4) SNA 그래프...........................................................................179
4.1.7 05. 특정 키워드 분석.....................................................180
1) Workflow 선택.......................................................................180
2) 데이터 불러오기.....................................................................180
3) 특정 키워드를 이용한 데이터 분류.............................................182
4) 특정 키워드에 대한 형태소 분석................................................183
5) 단어 길이 컬럼 생성.................................................................184
6) 불필요 단어 및 단어가 한글자인 단어 제거..................................184
7) 명사형 단어 추출.....................................................................185
8) 민원 건별 단어셋 생성.............................................................186
9) 문서-단어 행렬(DTM) 생성.......................................................186
10) 특정 키워드에 대한 EDA........................................................187
11) 특정 키워드에 대한 연관성 분석..............................................191
12) 특정 키워드에 대한 토픽 모델링..............................................192
4.1.8 06. 민원처리 프로세스 분석............................................195
1) Workflow 선택.......................................................................195
2) 데이터 불러오기.....................................................................195
3) 부서별 민원처리 현황..............................................................197
4) 이관시간 분석.........................................................................198

5) 순수처리 분석.........................................................................201
6) 연장처리 분석.........................................................................206
4.1.9 09. Tableau 시각화 데이터 생성.....................................211
1) Workflow 선택.......................................................................211
2) Data 불러오기........................................................................211
3) 기간별 민원 빈도 현황.............................................................215
4) 기간별 키워드 빈도 현황..........................................................216
5) 민원처리 분석 프로세스...........................................................216
6) Tableau를 이용한 시각화.........................................................217
4.2 바란다 민원 분석.........................................................218
4.3 콜센터 민원 분석.........................................................219
4.3.1 01. Load Data.............................................................219
1) Loading File..........................................................................219
2) 날짜타입 변환.........................................................................221
4.3.2 02. Data Preprocessing...............................................222
1) Workflow 선택.......................................................................222
2) Loading File..........................................................................222
3) 기간추가................................................................................223
4) 문서-단어 행렬(DTM)(전체)......................................................223
5) 연도별 데이터.........................................................................224
6) 문서-단어 행렬(DTM)(연도별)..................................................225
7) 연도별-월별 데이터.................................................................225
8) 문서-단어 행렬(DTM)(연도별-월별)...........................................226
9) 민원인 테이블.........................................................................226
10) 민원인별 데이터....................................................................227
11) 문서-단어 행렬(DTM)(민원인).................................................228
12) 상담대분류 테이블.................................................................228
13) 상담대분류별 데이터..............................................................229

14) 문서-단어 행렬(DTM)(상담대분류)...........................................230
15) 상담중분류 테이블.................................................................230
16) 상담중분류별 데이터..............................................................231
17) 문서-단어 행렬(DTM)(상담중분류)...........................................232
18) 문서-단어 행렬(DTM) 저장.....................................................232
19) 민원 내용 저장......................................................................233
4.3.3 03. EDA......................................................................234
1) 기간별 전체민원 건수..............................................................234
2) 시각화...................................................................................235
3) 워드클라우드 및 단어 빈도표....................................................236
4.3.4 04. SNA......................................................................237
1) Workflow 선택.......................................................................237
2) 데이터 불러오기.....................................................................237
3) 연도별 데이터.........................................................................238
4) 문서-단어 행렬(DTM)(연도별)..................................................239
5) SNA 분석..............................................................................240
6) SNA 그래프...........................................................................240
4.3.5 05. 연관성 분석............................................................241
1) Workflow 선택.......................................................................241
2) 데이터 불러오기.....................................................................242
3) 상담대분류 테이블..................................................................243
4) 상담대분류별 데이터...............................................................243
5) 문서-단어 행렬(DTM)(상담대분류)............................................244
6) 연관성 분석(상담대분류)..........................................................244
7) 상담중분류 테이블..................................................................245
8) 상담중분류별 데이터...............................................................246
9) 문서-단어 행렬(DTM)(상담중분류)............................................247
10) 연관성 분석(상담중분류)........................................................247
4.3.6 09. Tableau.................................................................248

4.4 칭찬 민원 분석............................................................249
4.4.1 분석 환경 설정..............................................................249
1) Workflow 선택.......................................................................249
4.4.2 01. Load Data.............................................................249
1) Loading File..........................................................................249
2) 날짜타입 변환.........................................................................251
3) 불필요 민원 제거.....................................................................252
4.4.3 02. Data Preprocessing...............................................253
1) Workflow 선택.......................................................................253
2) Loading File..........................................................................253
3) 기간 추가...............................................................................254
4) 문서-단어 행렬(DTM)(제목)......................................................255
5) 문서-단어 행렬(DTM)(내용)......................................................255
6) 연도별 데이터(제목)................................................................256
7) 연도별 데이터(내용)................................................................256
8) 연도별-월별 데이터(제목)........................................................257
9) 연도별-월별 데이터(내용)........................................................257
10) 문서-단어 행렬(DTM)(제목-연도별).........................................258
11) 문서-단어 행렬(DTM)(내용-연도별).........................................258
12) 문서-단어 행렬(DTM)(제목-연도별 월별)..................................259
13) 문서-단어 행렬(DTM)(내용-연도별 월별)..................................259
14) 문서-단어 행렬(DTM) 저장(내용).............................................260
15) 민원 내용 저장......................................................................261
4.4.4 03. EDA......................................................................262
1) 기간별 전체민원 건수..............................................................262
2) 시각화...................................................................................263
3) 워드클라우드 및 단어 빈도표....................................................264
4.4.5 04. 특정 키워드 분석.....................................................265
1) Workflow 선택.......................................................................265

2) 데이터 불러오기.....................................................................265
3) 특정 키워드를 이용한 데이터 분류.............................................266
4) 문서-단어 행렬(DTM)..............................................................267
5) 특정 키워드에 대한 EDA..........................................................268
6) 특정 키워드에 대한 연관성 분석................................................271
4.4.6 09. Tableau.................................................................272

5. Tableau 시각화..................................................................273
5.1 개요..........................................................................273
5.2 새올 민원 시각화.........................................................274
5.2.1 민원 현황 데이터 정의...................................................274
1) 민원 현황 (민원현황-기간별조회.csv)........................................274
2) 민원 현황 (법정동.csv)............................................................274
3) 키워드 현황 (민원현황-키워드조회.csv).....................................277
5.2.2 새올 민원 ‘민원 현황’ 화면 정의......................................278
1) 화면 정의...............................................................................278
2) 동작......................................................................................279
5.2.3 키워드 현황 화면 정의...................................................280
1) 화면 정의...............................................................................281
2) 동작......................................................................................281
5.2.5 민원프로세스 화면 정의.................................................282
1) 민원처리 프로세스 (민원프로세스.csv).......................................282
5.2.4 민원프로세스 데이터 정의..............................................282
1) 화면 정의...............................................................................283
2) 동작......................................................................................285

5.3 기타 민원 시각화.........................................................287
5.3.1 데이터 정의..................................................................287
1) 민원 빈도 조회(민원명-기간별조회.csv).....................................287
2) 대상별 키워드 조회(민원명-대상별키워드조회.csv)......................288
3) 키워드 조회(민원명-기간별키워드조회.csv)................................289
5.3.2 ‘민원 빈도 조회’ 화면 정의.............................................290
1) 화면 정의...............................................................................290
2) 동작......................................................................................291
5.3.3 ‘대상별 키워드 조회’ 화면 정의.......................................291
1) 화면 정의...............................................................................291
2) 동작......................................................................................292
5.3.4 ‘기간별 키워드 조회’ 화면 정의.......................................292
1) 화면 정의...............................................................................293
2) 동작......................................................................................294

 

 

 

** 출처: [공공데이터포털] 공공 빅데이터 표준분석모델 매뉴얼 - 민원분야

** 문서:

(최종)20170125 민원분야.vol1.egg

(최종)20170125 민원분야.vol2.egg

(최종)20170125 민원분야.vol3.egg

(최종)20170125 민원분야.vol4.egg

(최종)20170125 민원분야.vol5.egg

(최종)20170125 민원분야.vol6.egg

(최종)20170125 민원분야.vol7.egg

(최종)20170125 민원분야.vol8.egg