본문 바로가기
IT 와 Social 이야기

[iitp] IBM 100만 명 얼굴 정보 담은 데이터셋 공개

by manga0713 2019. 2. 20.

 

 

 

 

 

 

■ IBM 100만 명 얼굴 정보 담은 데이터셋 '(Diversity in Faces: DiF)' 공개

 

 

- IBM 기초연구소의 연구팀은 실제 얼굴인식 시스템의 성능에 영향을 미치는 것은 “내재적인 얼굴의 다양성”이지 인식의 정확도가 개인이나 집단에 따라 달라질 수는 없다는 입장이며, DiF 데이터셋의 공개 목적이 얼굴인식 기술의 ‘공정성’ 향상이라고 한 것은 이런 연유임

 

- DiF에는 다양한 성별과 인종의 얼굴 이미지와 그에 대한 주석이 포함되어 있으며, 약 100만 명분의 데이터가 포함되어 있다고 함

 

 

 

[ DiF 데이터셋의 정보 라벨링 ]

 

 

 

 

- DiF 데이터셋의 각각 이미지에는 머리 모양과 얼굴의 대칭, 코의 길이, 이마의 높이 등 얼굴의 객관적 척도와 함께 연령이나 성별 등의 주석 데이터가 라벨링 되어 있다고 함

 

- 연구팀에 따르면 주석 데이터에는 얼굴 부위 47곳 이상의 크기와 특징이 정리 되어 있으며, 이것이 얼굴인식 시스템의 공정성과 정확성을 향상시키고 알고리즘의 성능을 더욱 강력하게 만드는 학습 교사의 역할을 하고 있음

 

- DiF 데이터셋은 전세계에 있는 얼굴인식 시스템 연구 커뮤니티에 제공되는데, DiF에 접속을 원하면 IBM 기초연구소의 설문 조사에 응하고 이메일로 신청하면 됨