- 출처 : [NIA] 인공지능 시대, 벤치마크 데이터셋의 중요성 - 우상근 책임
1. 벤치마크 데이터셋
- 벤치마크 데이터셋 예시
- 벤치마크 데이터셋은 공통된 기준으로 인공지능 정확도를 평가하고 경쟁할 수 있는 기반이며, 인공지능 발전에 핵심 역할을 담당하고 있음
- 자연어 이해, 이미지 분류, 얼굴인식 등 다양한 종류의 글로벌 벤치마크가 존재하며 국내도 최근 언어 모델 전문가들이 협업을 통해 벤치마크 데이터셋 구축
2. 벤치마크 데이터셋의 인공지능 생태계 내 주요 역할
1) 공통된 평가 기준으로 인공지능 모델 성능의 객관성 확보
- 벤치마크 활용 방법은 크게 두 가지이며, 정해진 벤치마크 데이터셋만을 통해 모델을 학습하고, 성능을 테스트(평가)할 수도 있고,
- 다양한 데이터를 통해 모델을 구축하고, 벤치마크 데이터로 미세조정(Fine tuning, 추가 학습) 후 모델을 테스트하는 유형이 있음
2) 공정한 경쟁 환경 조성을 통해 성능 한계 극복(리더보드)
3) 우수한 모델이 대거 쏟아져, 파일럿 테스트 및 산업적용 가속화
- 벤치마크에서 SOTA를 달성한 모델들은 후속 연구를 위해 대부분 공개되고 있고, 여러 연구원들이 재현 해보며 검증하는 문화 확산
'IT 와 Social 이야기' 카테고리의 다른 글
[IITP] 심리상담용 RNN 기반 대화형 AI챗봇 개발 방안 (0) | 2021.11.11 |
---|---|
[NIA] 포스트 코로나 시대 디지털 플랫폼 변화 전망 (0) | 2021.11.09 |
[NIA] 디자인 단계에서의 AI 리스크 회피 방안 (0) | 2021.11.04 |
[kocca] 메타버스와 콘텐츠 (0) | 2021.11.02 |
[KIaT] 포스트 코로나 시대 바이오 의료기기 및 진단장비 기술개발 동향 보고서 (0) | 2021.11.01 |