본문 바로가기
책 이야기

[함유근] 이것이 빅데이터 기업이다

by manga0713 2015. 4. 27.

 

 

 

 

빅데이터.

이것이 밝혀 미래에 대하여 실재와 확신을 해주는 입니다.

 

기회를 보고 있지만 다가갈 순서와 들어 곳에 대하여 확신을 가지지 못한 개인이나 기업 모두에게 저자는 실증을 통한 이정표와 지도를 제시합니다.

 

모두들 살펴보고 함께 나누며, 다가갈 순서와 들어 곳에 대한 전략을 재점검하는 기회를 가져보시길 권합니다.

 

다음은 책의 밑줄 부분 입니다.

 

 

미래기업의 열쇠, 빅데이터

 

기술의 변화는 인력의 변화를 요구한다. ~ 디지털화와 빅데이터로 인한 세상의 변화는 기업들의 변모를 요구하고 있고, 이런 추세에 따라 빅데이터를 활용해 전혀 새로운 방식으로 비즈니스를 하는 기업들이 나타나고 있다.

 

법률 정보 서비스 솔루션 제공업체 LexisNexis 독점적인 콘텐츠에 대한 투자를 늘려 더욱 유연한 플랫폼을 구축해 차별화를 도모하고 있다.

 

의료산업에서도 빅데이터 활용에 따라 이론의 정립과 검증보다는 발견이 주도하는 패러다임의 전환이 나타나고 있다.

 

데이터는 '세상의 흔적'이라고 있다. 흔적이 남아야 데이터도 존재한다. ~ 디지털 시대의 흔적은 더욱 쉽게, 더욱 방대하게 남겨진다.

 

데이터의 변화: 1950~1960년대 생산물(product), 1970~1980년대 부산물(byproduct), 1990~2000년대 자산(asset), 2010 이후 기본물질(substrate), 세상의 흔적이 자동적으로 남는 빅데이터 시대에 데이터는 남보다 빨리 알고 정확하게 대응할 있는 원천이 되었다.

 

이제는 누구나 데이터를 소유할 있지만 이를 통해 비즈니스를 어떻게 혁신시키느냐에 따라 전혀 다른 서비스나 경쟁력이 나타나는 시대가 되었다. 이런 까닭에 "실질적인 데이터 혁명은 비즈니스 구조와 프로세스, 그리고 정보 활용 방법에 있다"라는 이야기가 나오는 것이다.

 

빅데이터는 기존 문제를 새로운 방식으로 해결하는 영역뿐만 아니라 지금까지 해결할 없었던 문제나 해결하려고 들지 않았던 문제를 해결하는 수단으로서 가치가 커질 것으로 예상된다.

 

빅데이터는 새로운 해결책이지만 동시에 새로운 문제(니즈)이기도 하다.

 

빅데이터 생태계는 데이터가 만들어지는 부분(data creation), 데이터를 보유하고 축적하는 부분(data acquisition), 데이터를 처리하고 분석하는 부분(info processing), 데이터를 비즈니스에 응용하는 부분(business process) 상호 연관되어 시장에서 필요한 가치를 창출하는 구조와 과정으로 이뤄진다.

 

디지털 시대에는 빅데이터 비즈니스 모델의 3요소(데이터, 플랫폼, 고객경험) 결합되어 고객가치를 창출하는 비즈니스 모델이 유효하다. [MIT 경영대학원 Weill, Woerner 교수]

 

빅데이터 비즈니스 모델의 특징 하나로 데이터를 중개하는 플랫폼을 꼽을 있다. 이를 '빅데이터 큐레이션(Big Data Curation)'이라고 하는데, 어떤 기업들은 자신이 보유한 데이터에 외부 데이터를 더해서 중개하기도 하고, 어떤 기업들은 데이터를 보유하지 않은 전적으로 중개 기능만을 플랫폼으로 제공하기도 한다.

 

플랫폼은 고객 경험을 구현하는 통로라고 있다.

 

데이터 사이언티스트(Data Scientist) 분류 [Harris H. Murphy] = 빅데이터 비즈니스 모델의 유형 분류

①데이터 비즈니스맨(Data Business People)

상업적 활용이 가능한 데이터가 많은 기업에서 데이터를 가공하거나 분석하기보다는 활용 방안을 찾는 전문가들로서, 기술적 지식을 쌓기보다는 사업 도메인에 데이터 활용을 연결시킨다.

 

②데이터 창출자(Data Creatives)

데이터를 가공하고 분석해서 새로운 정보와 지식을 만들어내는 기술 전문가들로, 데이터를 단순히 분석하는 아니라 고차원적 수학이나 통계학, 컴퓨터 공학, 물리학 등의 이론과 기법을 데이터 분석에 적용한다.

 

③데이터 대리인(Data Developer)

데이터 관리를 전문으로 하는 사람들이다. 업무 과정에서 많은 데이터가 발생하는 기업들에선 데이터를 분류, 정리, 저장, 유지, 관리하는 것이 매우 중요한 일이다. 이런 작업을 전문으로 한다. 기존 데이터베이스 관리에 더해 비정형적 데이터까지 관리하는 사람들이 부류에 속한다.

 

④데이터 연구가(Data Researchers)

특정 분야나 산업의 지식에 정통해 자신의 전문 분야에 데이터를 활용하는 사람들이다. 하나의 전문 분야에 대해 깊이 잇는 학술적 연구를 진행하는 전문가라고 있다.

 

⑤빅데이터 응용가(본서에서 추가)

기존 서비스를 빅데이터를 이용해 차별적인 서비스로 변모 시키기 위하여 응용 분야에 집중하는 전문가들이다.

 

빅데이터 비즈니스 모델의 경쟁력

①차별화된 특징(distinctive features)

데이터 자체의 차별성, 플랫폼의 차별성, 분석 능력의 차별성 등으로 구분할 있다.

사람들은 단순한 기능 차이에 따른 제품의 차별성을 크게 느끼지 못하게 되었다. 고객과 고객이 제품을 소비하는 상황의 차별성이 주목 받는 시대가 것이다. 빅데이터를 통해 누가 언제 어떤 상황에서 덥다고 느끼는지 정확하고 신속하게 찾아내는 것이 바로 차별성을 지닌 빅데이터 비즈니스 모델을 구축하는 방법이다. 데이터 분석 능력의 차별성이 점점 중요해지고 있는 것이다.

 

②독점성(exclusivity)

데이터 수집이나 창출, 분석기법을 독점할 획득된다. 경우에 따라 외부 데이터의 소유주와 독점적인 사용 계약을 맺어 비즈니스 모델의 유효성을 높이기도 한다.

 

③저비용(low cost)

누구나 수집할 있는 데이터 소스를 이용하더라도 생산성 높은 방식을 가진 기업은 우위에 있다. 제조업계에서 같은 제품을 만들어도 높은 생산성으로 비용을 낮추는 기업이 경쟁력 있는 것과 마찬가지다.

 

 

빅데이터 비즈니스맨

 

데이터는 필요에 따라서는 매우 상세하고(데이터의 깊이, deep data), 과거로부터 현재까지 어떤 변화가 있었는지 자세히 보여주며(데이터의 길이, long data), 관심 주제 혹은 의사결정 사안에 대한 모든 이슈를 다뤄야 한다.(데이터의 , broad data), 마지막으로 데이터 이용자가 필요로 하는 특정 시점의 데이터가 있어야 한다.(데이터의 시점, timely data)

 

①데이터의 깊이는 얼마나 상세하게 현상을 분석하느냐로 표현된다. 매출액보다는 매출액, 나아가 시간당 매출액 데이터가 깊이 있다고 있다.

 

②데이터의 폭은 관심을 가진 대상에 대한 모든 정보를 제공한다는 의미다. Variety와는 다른 개념이다.

 

③데이터의 길이는 얼마나 오랫동안 데이터를 축적했는가와 관련돼 있다. 오래 축적된 데이터일수록 장기 트랜드를 예측하거나 분석하는 유용하다.

 

④데이터의 시점은 적절한 시점(적시에 최적의 서비스를 제공하기 위한) 데이터를 의미한다.

 

빅데이터 비즈니스맨 모델의 취약점 하나는 어렵게 축적하고 수집한 데이터의 가치가 새로운 기술의 출현으로 한순간에 사라질 있다는 것과 개인정보 보호 같은 사회적 압력을 심각하게 고려해야 한다.

 

데이터의 축적이 없는(없었던) 기업의 빅데이터 사업 접근법: ①기존 제품으로부터의 데이터 수집 ②자산의 디지털화 ③다른 기업과의 제휴나 파트너십 ④서비스 능력의 코드화

 

우리나라와 일본은 개인이 승낙하지 않으면 아무 곳에도 개인정보를 사용할 없는 방식(Opt-in), 미국 등은 개인정보 보호와 상업적 이용 간의 균형을 추구해 개인이 거부하지 않으면 개인정보를 사용할 있는 정책(Opt-out) 따르고 있다.

 

모바일 인프라를 운영함에 따라 기지국이 주기적으로 파악하는 단말기의 위치 정보를 지리적, 시간적 유동 인구 거주 변화를 추적하는 사용했다. 단말기의 지리적, 시간적 위치 변화는 단말기 가입자의 연령이나 성별 등의 특성을 반영한다고 있다. 다시 말하면 특정 지역에서 인구의 동적 변화를 요일 시간대별로, 그리고 연령 성별에 따라 구분하여 파악할 있는 것이다.

 

NTT 도코모는 자회사 '도코모 인사이트 마케팅' 통해 휴대전화 네트워크를 이용하여 거주 지역별, 시간별, 연령별, 성별 인구 분포를 추정할 있는 '모바일 공간 통계' 실용화하고 2013 10월부터 관련 데이터를 제공하기 시작했다.

 

 

빅데이터 창출자

 

디지털 기술의 발달로 필요하다면 데이터를 만들어낼 있는 세상이 되었다. 남이 가지고 있지 않은 데이터를 만들어내거나 수집해 가공한 차별화된 데이터로 고객가치를 창출하는 비즈니스 모델 기업이 바로 '빅데이터 창출자'.

 

빅데이터 창출자가 제공하는 고객가치는 대부분 기존 데이터의 가공이나 응용보다는 새로운 데이터의 확보에 기인한다. 이렇게 해서 확보된 데이터의 차별성이 바로 고객가치를 만들어낸다.

 

데이터 브로커(data broker)

 

액시엄이 데이터를 확보하는 소스: ①외부에 공개되는 공공 데이터 ②설문조사나 질문지 ③고객들이 자신에 관한 데이터를 사용할 있도록 허락한 상업기관이 수집한 데이터

속성

내용

개인정보

취미, 관심사, 친구, 가족

기본 데이터

이름, 주소, 성별, 인종, 직업, 교육 수준,  결혼 여부, 자녀 숫자, 자녀의 나이/성별

삶의 변화 계기

결혼, 주택 구입, 이사, 임신 출산, 자녀의 대학 진학 여부

재무 정보

상품 구매 정보, 월급, 자산(부동산, 차량) 상황, 장기 주택담보대출 등의 상황

공공 기록

파산 신청, 이혼 신청, 범죄 기록 혹은 법정 기록, 교통사고 기록

 

푸드 지니어스의 영향력은 인터넷상에 올라와 있거나 다른 기관들이 보유한 데이터들을 취합, 정리해 메뉴 자체뿐만 아니라 메뉴를 구성하는 음식 재료와 , 기타 여러 가지 측면을 분석하는 능력에 기인한다.

 

에디트의 강점은 인터넷상의 콘텐츠를 실시간으로 수집, 분석해 브랜드 의류 제조업체와 유통업체에 시장의 최신 현황을 알려주고, 제품 가격 스타일링, 재고 수준, 고객 반응 등을 경쟁사와 비교, 분석할 있게 도와주는 있다.

 

빅데이터 시대의 블루오션은 기존에 없던 새로운 데이터로 만들어내는 시장이 것이다.

 

스타일시크(stylese) 스타일게임이라는 방식으로 개인의 '스타일 DNA', 패션 취향을 찾아낸다.

 

팩추얼(Factual) 세상의 팩트와 관련된 모든 데이터(현재는 위치 관련 데이터에 치중) 수입, 정리해 판매하는 회사다.

 

데이터가 돈이 되는 경우 3가지 [ 슈마르조, EMC]: ①자신이 보유한 데이터(분석한 결과와 함께) 포장해 다른 기관에 판매하는 것이다. ②자신의 상품이나 서비스에 분석기법을 적용해 인텔리전트한 제품을 창출하는 것이다. ③유용한 정보를 추천해 고객과의 관계를 긴밀히 하고 고객의 경험을 높은 수준으로 재구현하는 것이다.

 

 

빅데이터 대리인

 

빅데이터를 활용하려는 기업들에 가장 필요한 것은 데이터 자체라기보다 데이터에서 추출된 인사이트(통찰력), 나아가 인사이트를 바탕으로 적절한 의사결정 혹은 업무 완수다.

 

불필요한 정보를 걸러내는 것도 경쟁력이다: 너무 많고 다양한 데이터가 시시각각 쏟아지는 빅데이터 시대에는 중에서 고객에게 필요한 데이터를 추려서 정리해주고, 나아가 문제를 찾아주고 답을 제시하는 빅데이터 대리인형 비즈니스 모델도 충분한 고객가치를 창출할 있다는 사실을 리스로직은 보여준다.

 

기업은 규모가 크든 작든 항상 위험에 노출되어 있다. 스마트한 위험관리를 원하는 기업들에 빅데이터는 필수적이다. 문제는 위험관리를 위해 다루어야 데이터의 규모나 종류가 너무 많으며, 이들이 대부분 기업 외부에 존재한다는 사실이다. 모든 기업이 위험을 다루는 능숙한 것은 아니다. 그래서 기업의 위험관리에는 개방형 혁신이 필요하다.

 

빅데이터 활용에 정해진 분야는 없다.

 

 

빅데이터 연구자

 

10 정도의 정보가 모여야 유전병의 정확한 규명과 맞춤형 의약 개발 등에 활용할 데이터가 생긴다.

 

컨설팅 회사들이 경영에 어려움을 겪고 있는 것은 구체적이고 유효한 대안을 제시하지 못하고 있기 때문이다. 이러한 문제를 해결하는 역시 빅데이터 연구자형 비즈니스 모델의 성공적인 구현 여부에 달려 있다.

 

왓슨(Watson) 답하기 어려운 질문에 대해 다양하고 방대한 자료를 뒤져 적합한 대답을 찾아내는 과정에서 가치가 드러난다.

 

애플의 시리가 질문을 정확히 이해하고 답하는 초점을 반면 왓슨은 방대한 자료를 뒤져서 답을 찾는 초점을 둔다. 시리가 다양하고 간단한 일반적인 질문에 상식적인 답을 하는 것을 목표로 개발되었다면 왓슨은 특정 분야의 전문가로서 정확하고 적절한 답을 제시하는 것이 목표였다.

 

시리는 일반적인 상식으로 답하는 수준에서 출발해 많은 데이터가 더해지고 통합되면서 다양한 분양의 전문성을 배양하고 있다. 반대로 왓슨은 분야의 전문성을 토대로 다른 분야들을 섭렵하면서 지식의 폭을 넓히고 있다. 만물박사로 향하고 있는 것이다.

 

 

빅데이터 응용가

 

이들은 빅데이터를 이용해 이전에 존재하지 않았던 고객가치를 창출한다는 점에서 다르다. 이들은 주로 디지털화의 영향을 많이 받는 산업에서 빅데이터를 바탕으로 새로운 틈새시장을 개척한다. 빅데이터 분석 능력을 더해 기존 기업의 서비스 수준을 넘어선 혁신적인 기업들이다. 데이터 처리의 거의 모든 단계에서 강점이 필요하기 때문에 이런 모델을 구축하고 유지하는 것은 다른 빅데이터 비즈니스 모델에 비해 상대적으로 어렵다. , 데이터 수집이나 분석만 잘해서는 되며 기존 기업이 제공하는 서비스 수준을 넘어서는 가치를 제공할 있도록 데이터를 활용해야 하기 때문에 종합적인 빅데이터 처리 역량이 필요한 비즈니스 모델이다.

 

보통 은행들이 40 미만의 변수로 구성된 모델을 통해 개인의 신용도를 평가하는 비해 제스트파이낸스는 7 개의 변수에 대한 데이터를 수집하고 구글의 기계학습 방식으로 모델을 구축해 개인의 신용도를 분석한다.

 

제스트파이낸스에 따르면 대출 신청 대문자로만 서류를 작성하는 사람이 대소문자를 함께 쓰는 사람보다, 그리고 대소문자를 정확히 사용하는 사람보다 연체 가능성이 높다고 한다.

 

제스트파이낸스의 방식은 기존 신용평가 방식에 비해 거의 60% 개선된 것으로, 대출상환율도 기존 방식에 비해 90% 높았다.

 

클라이미트 코퍼레이션은 자체 알고리즘을 이용해 미국 전체 지역을 50 개의 세부 지역으로 나누어 지역에 대한 1만여 개의 일일 날씨 시나리오를 만들어낸다. 이런 정보를 이용해 옥수수, , 보리 농사 등의 가뭄, 혹서, 냉해 피해에 대비한 맞춤화된 보험이 만들어진다.

 

세상에는 수많은 위험이 존재한다. 이를 예측하고 계량화하는 것이 빅데이터의 몫이 되고 있다. 위험을 예측할 있는 변수에 관한 새로운 데이터 소스의 접근과 창출이 가능해지면서 보험 산업의 혁신도 가속화될 것으로 전망된다.

 

 

소개된 기업

 

-내러티브 사이언스(Narrative Science), (Quill) 프로그램으로 기사 작성, 서비스

-LexisNexis 법률 서비스 플랫폼

-콘텍스추얼(Contextuall), 투자정보 큐레이션

-Sony Felica

-스페인 Telefonica, Telefonica Digital Insight Smart Steps: 소매업체 등에 휴대전화 사용자의 하루 이동 경로를 보여주는 heat maps 제공

-미국 Verizon. Precision Market Insight

-이동통신사의 고객 이탈 방지를 위한 빅데이터 분석 PwC (2012). "The benefits of big data analytics: A carrier example". PwC Technology Forcast, Issue 1

- PriceStats 세계 온라인 소매업체의 제품 가격 데이터를 실시간으로 수집. 웹에 올라온 제품 사진을 파악해 신상품 출시 여부도 인식

-질로(Zillow), rhdroehls 자료와 데이터들을 바탕으로 부동산 가격을 정확히(실제와 가깝게) 예측해 제공

-아이웨어랩(I-ware Lab) 체형 데이터에 전문화된 기업

 

-빅데이터 비즈니스 모델의 유형별 사례 기업들

모델유형

해당기업

빅데이터 비즈니스맨

Luminar, NTT Docomo Insight, Monster Government Solutions, East Japan Railway, MailChimp

빅데이터 창출자

Acxiom, Factual, Waze, I-Ware Lab, MapMyRun, Food Genius, EDITD, Viki, Zilow, Amazon Price Check, Recorded Future, PriceStats, Contextual, Disney, MagicBand, Stylese다

빅데이터 대리인

Knewton, NumberFire, NextBio, INRIX, Sansan, DataSift, ListenLogic, Socrata, What's Watched, Carlio, Decide.com

빅데이터 연구가

Beijing Genome Institute, Evogene, Hitachi Global Center for Innovative Analytics, Osaka Gas Information System Research Institute

빅데이터 응용가

Pandora, Sportify, Climate Corporation, ZestFinance, Shazam, Jini, Zynga, Wonga, Apple TV