본문 바로가기
IT 와 Social 이야기

[LG경제연구원] 최근 인공지능 개발 트렌드와 미래의 진화 방향 - 이승훈

by manga0713 2017. 10. 13.

 

 

 

*** 출처: [LG경제연구원] 최근 인공지능 개발 트렌드와 미래의 진화 방향

*** 문서:

LGERI_Report_20171010_20170110170112387.pdf

 

 

 

2. 인공지능의 최근 개발 트렌드

 

 

 

 

 

- 2012년을 기점으로 본격적으로 발전하고 있는 인지 분야의 지능은 이미 인간 능력 이상의 수준으로 구현되고 있다.

 

- 지능 발전의 가장 큰 걸림돌이었던 인지 분야의 해결은 인공지능이 현실 세계를 인간처럼 인식하는 것을 가능하게 하였고 이에 기반한 학습/추론/행동 분야의 연구가 매우 활발하게 진행되고 있다.

 

 

○ 이미지/영상의 인식과 이해

 

- 이미지 내 사물 인식의 정확도를 경쟁하는 ImageNet 경진대회에서 2015년 마이크로소프트가 96.43%의 정확도를 달성하며 인간의 인식률(94.90%)을 추월하였다. (2017년 정확도: 97.85%)

 

- 이미지 인식을 뛰어넘어 사람 얼굴 사진을 보면 남성, 여성 등과 같은 외형적 특성을 인식할 수 있을 뿐 아니라 눈, 코, 입 모양의 상관 관계를 분석해 표정을 인지하거나 감정을 추측한다.

 

- 2015년 구글이 발표한 논문에서는 이미지 속 상황을 정확히 이해해 인간의 언어로 표현하기도 한다.

 

- 시각 지능을 통해 이미지를 인식하고 이해하게 된 인공지능은 이미지 속 상황에 대한 물에 대해 정확히 답을 하기도 한다. --> 'Attention'이라고 불리는 방법을 통해 인공지능은 이미지 내 다양한 사물 중 질문의 답에 해당하는 부분에 스스로 집중하며 답을 찾아 낸다.

 

 

○ 이미지/영상의 합성과 생성

 

- 이제 시각 정보를 자유롭게 변형하거나 전혀 새로운 이미지를 생성해 내기도 한다. 이러한 가상의 이미지는 사람들이 쉽게 구분해 낼 수 없을 정도의 높은 완성도를 보이고 있다.

 

--> 풍경 사진의 계절적 특성을 이해한 인공지능은 하나의 풍경 사진을 여름, 겨울 사진으로 변경하거나 동물/식물의 특성을 정확히 이해해 동물의 외형을 자유롭게 변형하기도 한다. 또한 유명화가의 그림을 반복적으로 학습해 일반 풍경 사진을 특정 화가의 화풍이 접목된 그림으로 변환하기도 한다.

 

- 단순히 정지된 이미지 정보의 합성 수준을 넘어 실시간의 영상 변형, 합성까지 가능 --> 오바마 전대통령의 목소리만을 가지고 입 모양을 생성해 오바마 전대통령의 전혀 다른 연설 영상에 합성

 

- 세상에 존재하지 않는 전혀 새로운 사물을 생성 --> 2016년 발표된 StackGAN은 인간의 언어로 기술된 텍스트를 이해해 특정 사물을 생성하기도 한다.

 

 

○ 인간 수준의 언어 인식/이해 지능의 구현

 

- 매우 오래 전부터 다양한 기업들이 연구, 개발을 해오고 있지만 현재까지도 자유로운 대화가 가능한 수준까지는 구현되지 못하고 있다. --> 기존 사람(전문가, 온톨로지) 중심 방법론의 한계 때문

 

- 최근 딥러닝이 적용되면서 과거와 달리 사람(전문가)에게 의존하지 않고 인공지능이 데이터에 기반한 학습을 통해 스스로 언어를 이해하게 하는 방식으로 전환되고 있다.

 

- 이렇게 데이터를 기반으로 구성된 언어 모델은 과거 온톨로지 방식에 비해 확장성이 높고 특정 분야에 종속(Domain Dependent)되지 않는다.

 

- 딥러닝이 적용되면서 음성 생성은 개별 단어 단위의 발음, 악센트(Accent) 뿐만 아니라 문장 단위에서의 억양(Intonation)까지 매우 정교한 수준으로 구현되고 있다. --> 약 100여개의 문장에 대해 사람의 목소리와 비슷한 정도를 계량ㅘ해 테스트한 결과에서 딥마인드가 발표한 WaveNet은 사람의 목소리(4.55점)에 근접한 4.21점을 기록했다.

 

 

 

 

- 이러한 언어 인식/이해 기술의 혁신적인 발전은 애플 Siri, 아마존 Alexa와 같은 지능형 비서 서비스를 더 활성화시킬 것으로 전망된다.

 

 

 

○ 학습 지능의 발전

 

- 강화학습 방법에서는 인공지능이 스스로 현재의 환경을 인식하고 행동하며 목표를 달성해 나간다. 게다가 이러한 방식은 범용적으로 활용 가능해 새로운 환경에서도 학습을 반복하게 되면 하나의 알고리즘을 가지고 매우 다양한 환경에 적용 가능한 인공지능을 구현해 낼 수 있다.

 

- 딥마인드의 연구로 본격화된 강화학습 알고리즘의 연구는 약 2년만에 엄청난 발전을 이루고 있다. 간단한 2차원 게임 환경을 넘어서 3차원, 물리 환경에 기반한 연구들이 빠르게 진행되며 현실 세계에 강화학습 기반의 인공지능 구현을 앞당기고 있다.  --> 주요 자동차 제조사의 선행연구 기관에서는 강화학습을 적용한 지능형, 자율 주행 기능을 시도하고 있다.

 

 

 

○ 추론/행동 지능의 발전

 

- 주어진 정보들을 기초로 하여 전혀 새로운 명제를 도출하는 추론(Inference/Reasoning) 과정은 기계적으로 구현하기 매우 어려웠다. 텍스트, 이미지 등으로 주어지는 정보를 인식해 정보의 문맥적 의미를 이해해야 할 뿐 아니라 같은 정보라도 상황 별 변화하는 문맥적 관계를 고려하며 이해하는 과정이 요구되기 때문이다.

 

- 하지만 최근 딥러닝 기반의 추론 방식은 과거와 달리 인간의 개입을 최소화하며 인공지능이 스스로 정보의 문맥적 의미를 이해해 추론해 낸다는 점에서 크게 다르다. 이것이 가능하게 된 요인은 딥러닝을 통한 인공지능의 언어분야에 대한 '인지/이해' 수준의 진전, Attention, LTSM과 같은 딥러닝 분야의 알고리즘 고도화, 추론 과정을 학습할 수 있는 학습용 데이터의 공개 등이다.

 

- 관계 추론이 가능한 인공지능의 등장 --> 딥마인드는 지난 6월 관계형 추론(Relational Reasoning)이 가능한 인공지능을 구현한 논문인 관계 네트워크(Relation Network)를 발표했다. --> 인공지능이 인식된 객체에 대해 ㅓ로 간의 상대적인 관계를 추론하는 것으로서, 인공지능의 추론 과정이 이제 사람의 추론 방식과 유사하게 구현 가능하다는 것을 의미한다. (관계형 질문: "나무 간의 높이 차이가 가장 크게 나는 두 나무 중 오른족 나무의 모양은?")

 

 

 

○ 미래 상황을 예측하고 계획하는 인공지능의 등장: Imagination and Long-term Planning

 

- 인간 수준의 행동이란 단순히 현재 만을 고려해 행동하는 것이 아니라 현재의 행동이 미래에 미치는 영향을 고려하고 동시에 최종적인 목적 달성을 위해 매 순간 계획(Planning)과 결정(Decision)이 동반되어야 하기 때문에 행동(Action)은 추론과 마찬가지로 인공지능이 인간 수준으로 구현되기 매우 어려운 분야로 생각되어 왔다.

 

- 딥마인드의 연구는 인공지능이 매 순간의 행동에 대해 미래에 미치는 영향을 상상(Imagination)해 최적의 행동을 선택한다. 이 과정에서 최종의 목적을 달성하기 위해 인공지능은 장기적 관점에서 계획(Long-term Planning)하고 행동한다. 현재 시점에서는 손해가 동반되는 선택이라 하더라도 이러한 행동이 최종 목적 달성을 위한 과정이라고 판단된다면 행동하는 것이다. 이러한 점에서 기존 강화학습 연구들과는 큰 차이가 있다.

 

- 딥마인드는 이러한 과정을 Sokoban이라는 게임에 적용해 증명하였다.