본문 바로가기
IT 와 Social 이야기

[SPRi] 범용 인공지능의 개념과 연구 현황

by manga0713 2018. 8. 13.

 

[범용 지능을 특징화하기 위한 다양한 접근 방법]

 

 

 

 

*** 출처: [SPRi] 범용 인공지능의 개념과 연구 현황

*** 문서:

[이슈리포트 2018-002] 범용 인공지능의 개념과 연구 현황.pdf

 

 

 

 

2. 범용 인공지능의 개념과 접근 방법

 

 

- 범용 인공지능은 아직 개발되지 않은 기술이기 때문에, 그 정의 역시 구체적이지 않은 것이 사실이다.

 

- 많은 학자들은 범용 인공지능을 인간 수준의 지능(Human-level Intelligence)으로 일컫는다.

 

- 범용 인공지능을 인간 수준의 지능을 구현한 기계장치로 바라본다면, 범용 인공지능은 다양한 목표를 달성하기 위해 능동적으로 해결책을 찾는 시스템이라고 볼 수 있다. 핵심 범용 인공지능
가설(The Core AGI Hypothesis: 벤 괴르첼(Ben Goertzel) 박사)

 

※ The Core AGI Hypothesis

 

- 충분히 넓고(인간 수준) 강한 범용성을 갖는 인공지능의 창조나 연구. 질적인 측면에서 상당히 좁고 약한 범용성과 반대되는 개념

 

- the creation and study of synthetic intelligences with sufficiently broad (e.g. human-level) scope and strong generalization capability; is at bottom qualitatively different from the creation and study of synthetic intelligences with significantly narrower scope and weaker generalization capability

 

- MIT의 물리학과 교수인 맥스 테그마크 역시 범용 인공지능의 출현은 곧 초인공지능을 의미한다고 밝혔다.이 관점은 인간과 범용 인공지능은 단순한 주종관계가 아니라, 서로 공존하는 관계로 정립돼야 함을 내포한
다. 이에 인공지능 연구자들은 2017년 아실로마 학회에서 인공지능을 이롭게 활용하기 위한 23개 원칙을 정립했다.

 

- 아실로마 23대 AI 원칙

 

 

 

 

 

 

○ 범용 인공지능의 접근 방법

 

① 기호적 범용 인공지능(Symbolic AGI) 

 

- 사람은 물체를 인식할 때 기호를 부여한다. 그리고 그 기호 간의 관계를 정립함으로써 논리적인 구조를 만들고 비슷한 상황을 추론 할 때 활용한다. 이렇게 기호적 인공지능은 지능이 기호를 다루는 행위로 정의하는 분야다.

 

- 장점은 접근방법 자체가 일반화에 가장 적합한 도구라는 것으로 심층학습과는 다르게 다양한 지능적 활동을 할 수 있다.

 

- 기호는 간단한 지각이나 동기로 인해 변화하거나 진화할 수 있기 때문에, 단순히 기호와 규칙만으로 범용 지능을 구현하기에는 한계가 존재한다.

 

 

② 창발적 범용 인공지능(Emergentist AGI)

 

- 인간의 뇌의 작동 방식을 다양한 방식으로 모사하여 구현하는 인공지능을 의미한다.

 

- 뇌의 구조와 기능을 역공학 (reverse engineering)으로 해석하여 기계로 구현하는 방법이 일반적이다.

 

- 뇌의 생리학적 규명이 아직 완벽하지 않기 때문에, 더불어 창발적 범용 인공지능의 물리적 한계가 존재할 수 있다고 볼 수 있다.

 

 

 

 

3. 범용 인공지능의 연구 현황

 

(1) ACT-R (Adaptive Control of Thought – Rational)

 

- 대표적인 기호적 범용 인공지능 접근방법의 인지 아키텍처(Cognitive Architecture)로 1973년부터 시작된 유서 깊은 인공지능 연구다.

 

- 인간의 인지(cognition)가 어떻게 작동하는지에 대한 이론을 컴퓨터를 활용해 구현하여 다양한 임무를 해결하는데 접목됐다. ACT-R의 이론은 심리학 실험에서 파생된 수많은 사실과 인간의 인지의 과정에 대한 가정(assumption)을 통해 정립된다.

 

- ACT-R의 개괄적인 흐름

 

 

 

 

 

 

- 대표적인 응용 분야는 인간의 기억, 자연언어처리, 인지 뇌과학, 교육 등 다양하게 활용된다.

 

- 2017년 7월 기준 7.5 버전이 공개돼 있다. (ACT-R software, http://act-r.psy.cmu.edu/software/)

 

 

 

(2) Soar

 

- ACT-R과 마찬가지로 대표적인 기호적 범용 인공지능 연구이며 인지 아키텍처이다. 1983년 처음 연구 프로젝트가 시작됐고 ACT-R과 함께 전통적인 인공지능 연구를 대표한다.

 

- 범용 지능을 갖는 에이전트를 만들기 위해 그 구성 요소기술(building blocks)을 개발하는 것을 목표로 한다. 이 에이전트는 인간의 거의 모든 지적활동을 대체할 수 있는 것으로 의사 결정, 문제 해결, 계획 수립, 자연어처리 등 광범위한 일을 할 수 있는 범용 인공지능이다.

 

- Soar는 범용 인공지능의 기능과 효율성에 집중을 한 반면, ACT-R은 인간의 인지에 대한 세부적인 모델링에 중점을 뒀다는 것으로 그 차별점을 찾을 수 있다.

 

- Soar의 메모리 모듈 구조

 

 

 

 

 

 

- 대표적인 응용 분야는 추론을 요구하는 퍼즐과 게임, 파일럿 시뮬레이션, 자연언어 이해, 로보틱스 등이 있다.

 

 

 

(3) CBMM (Center for Brains Minds+Machines, MIT)

 

- CBMM은 MIT의 연구소로 인간의 뇌구조를 역공학으로 구현하는 연구를 수행 한다.

 

- 현재 심층학습 기술은 이미지에서 사물을 인식하는데 매우 뛰어난 성능을 보유하고 있다. 그러나 사람이
가지고 있는 시각적인 지능은 복합적인 의사결정의 결과다. 예를 들어 500명이 앉아있는 강당의 첫 번째 줄에 있는 사람에게 “당신 뒤에 몇 명이나 있나요?” 혹은 “당신에서 가장 가까운 벽은 얼마나 떨어져 있나요?” 에 대한 질문에 대해 뒤나 벽을 보지 않고도 대답할 수 있을 것이다. 이처럼 사람의 시각 지능은 비단 시각적인 정보뿐만 아니라 경험과 직관에 의해 구성된다는 점이다. 따라서 현대의 심층학습은 지능이라기보다 고성능의 패턴 인식 기술이라고 볼 수 있다.

 

- 유아의 행동 발달과정을 분석하는 심리학자와 협업하여 시각지능을 구현하기 위한 가설을 세우고 실험을 통해 증명해 나가고 있다. 그 결과 유아의 행동을 역공학적으로 분석하여 아래 그림과 같은 가설을 세웠다. 이것을 구현하는 방법론으로는 확률적 프로그램(Probabilistic program)으로 소개했다.

 

- 확률적 프로그램은 기호적 지능 표현과 확률적 추론, 그리고 심층학습 구조를 융합하여 만든 개념이다.

 

- CBMM의 시각지능 구조 가설

 

 

 

 

 

 

 

 

(4) Meta-learning and Self-play

 

- 메타 학습 방법은 기본적으로 심층학습에서 파생되어 나온 분야다. 따라서 큰 의미에서 메타 학습은 창발적 범용 인공지능의 접근 방법으로 해석할 수 있다.

 

- 메타 학습의 출발은 강화학습으로부터 시작한다.

 

- 강화학습의 가장 큰 관건은 보상에 대한 정의다.

 

- 신경망 구조 탐색(Neural Architecture Search)은 최적의 심층신경망의 구조를 도출하기 위해 심층학습을 활용한 기술이다. 쉽게 말하자면 학습하는 방법을 학습하는 기술이다.

 

- 신경망 구조 탐색은 그림과 같이 순환신경망을 통해 파생되는 신경망을 학습하여 최적의 인공신경망 구조를 탐색한다.

 

 

 

 

[신경망 구조 탐색의 개념]

 

 

 

- 신경망 구조 탐색은 심층신경망 구조 자체가 미지수이기 때문에 매우 높은 자유도(degree of freedom)를 갖고 있다. 이로 인해 상당한 수준의 계산 자원을 필요로 한다. 최근 연구결과에서는 고성능 그래픽카드 한 장으로도 높은 성능을 이끌어 냈다.

 

- 강화학습을 비롯한 심층학습이 범용 인공지능으로 가기 위해서는 해결해 할 숙제 두 가지

 

① 학습과 시험용 데이터의 본질적인 차이

 

② 현재 심층학습 기술은 지속적인 학습이 거의 불가능하다는 점이다. 이미 학습된 인공신경망에 데이터를 추가적으로 학습하기 위해서는 상당히 많은 데이터가 필요하기 때문에, 이를 극복하기 위한 노력이 필요하다는 것

 

 

 

■ 범용 지능에 대한 다양한 해석

 

- 실용적 관점(Pragmatic Approach)

 

- 심리학적 관점

 

- 인지 아키텍처(cognitive architecture) 관점

 

- 수학적 방법

 

- 적응주의적(Adaptationist) 관점