■ IBM 100만 명 얼굴 정보 담은 데이터셋 '(Diversity in Faces: DiF)' 공개
- IBM 기초연구소의 연구팀은 실제 얼굴인식 시스템의 성능에 영향을 미치는 것은 “내재적인 얼굴의 다양성”이지 인식의 정확도가 개인이나 집단에 따라 달라질 수는 없다는 입장이며, DiF 데이터셋의 공개 목적이 얼굴인식 기술의 ‘공정성’ 향상이라고 한 것은 이런 연유임
- DiF에는 다양한 성별과 인종의 얼굴 이미지와 그에 대한 주석이 포함되어 있으며, 약 100만 명분의 데이터가 포함되어 있다고 함
[ DiF 데이터셋의 정보 라벨링 ]
- DiF 데이터셋의 각각 이미지에는 머리 모양과 얼굴의 대칭, 코의 길이, 이마의 높이 등 얼굴의 객관적 척도와 함께 연령이나 성별 등의 주석 데이터가 라벨링 되어 있다고 함
- 연구팀에 따르면 주석 데이터에는 얼굴 부위 47곳 이상의 크기와 특징이 정리 되어 있으며, 이것이 얼굴인식 시스템의 공정성과 정확성을 향상시키고 알고리즘의 성능을 더욱 강력하게 만드는 학습 교사의 역할을 하고 있음
- DiF 데이터셋은 전세계에 있는 얼굴인식 시스템 연구 커뮤니티에 제공되는데, DiF에 접속을 원하면 IBM 기초연구소의 설문 조사에 응하고 이메일로 신청하면 됨
'IT 와 Social 이야기' 카테고리의 다른 글
[정보통신기획평가원] ICT R&D 기술로드맵 2023 (0) | 2019.02.25 |
---|---|
[한국금융연구원] 금융권 Open API (0) | 2019.02.22 |
[US-CERT: Bulletin(SB19-049)] 2019년 2월 11일까지 발표된 보안 취약점 (0) | 2019.02.20 |
[US-CERT: Bulletin(SB19-042)] 2019년 2월 4일까지 발표된 보안 취약점 (0) | 2019.02.13 |
[US-CERT: Bulletin(SB19-035)] 2019년 1월 28일까지 발표된 보안 취약점 (0) | 2019.02.13 |