본문 바로가기
IT 와 Social 이야기

[nipa] 빅데이터 활성화를 위한 메타데이터 플랫폼 구축

by manga0713 2016. 10. 25.

[그림3] 빅데이터의 활용 단계

 

 

[그림4] 영화의 메타데이터 정의

 

 

Q: 메타데이터의 중요성이 더 강조되는 것 같습니다. 그렇다면, 빅데이터에서 메타데이터를 정의하기 위한 방법을 알려주시죠. 

 

빅데이터의 메타데이터를 정의하기 위해서 가장 먼저 할 일은 수집되는 빅데이터의 범위를 정해야 합니다. 빅데이터는 수많은 종류의 데이터가 들어오기 때문에 원하는 데이터를 구분하기 위해서 범위를 정하는 것이지요. 물론, 빅데이터 수집을 할 때는 목적을 가지고 수집하기 때문에 범위가 정해지는 것으로 봐도 무방합니다. IoT의 경우처럼 필요한 데이터와 불필요한 데이터가 공존할 수 있기 때문에 범위를 정해야 한다고 말씀 드리는 것입니다. 그림3을 보면, 데이터를 정제하면서 걸러지는 단계를 말합니다.

 

이제, 정제된 데이터로 데이터를 분석을 해야 하는데 어떻게 분석할 것인지가 중요한 것이지요. 그럼 예를 들어보겠습니다. 영화의 경우로 살펴보죠. 영화의 경우는 매번 똑 같은 값을 가지고 있는 고정된 데이터와 값이 계속 변하는 고정되지 않은 데이터를 가지고 있습니다. 고정된 데이터는 영화명, 제작사, 주연배우 등과 같은 데이터이고, 고정되지 않은 데이터는 관객수, 영화관수, 영화평점 등이 있습니다. 영화명이나 제작사는 아무리 시간이 지나도 변하지 않지만, 관객수나 영화평점은 시간이 지나면 계속 변화가 생기죠. 이렇게, 메타데이터를 두 가지로 구분해서 정의합니다(그림4).

 

 

 

 

 

-기사원문확인하기: [nipa] 빅데이터 활성화를 위한 메타데이터 플랫폼 구축