-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2018-01-02 데이터 최초 개방 소개
한국인 얼굴 특성에 맞는 각도, 조도, 가림, 표정, 해상도 등으로 한국형 얼굴 데이터 베이스를 구축한 이미지 데이터 제공
구축목적
연구 목적으로 활용되는 얼굴 데이터베이스는 대부분 해외에서 구축됨에 따라, 한국인 대상의 인공지능 기반 안면응용기술 개발에는 어려움이 있음 따라서, 한국에 실적용 가능한 기술 개발을 위해서는 한국인들의 얼굴 특성에 맞는 한국형 얼굴 데이터베이스가 필요함 이에 본 데이터 구축은 한국인 얼굴의 통계적 특징을 파악하기 위함을 목적으로 함
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2017년/2,860만 -
구축내용
- 한국인 얼굴에 대한 국내 특화 시각지능기술 및 서비스 개발을 위해 필요한 이미지 데이터의 제작, 수집, 분류 체계를 마련하고 관련 정보를 레이블링
- 얼굴 데이터의 실효성 제고를 위해 각도 20종, 조도 30종, 가림 6종, 표정 3종, 해상도 3종을 반영한 1,000명(인당 약 3만장)의 안면 이미지 데이터 제작
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 얼굴 인식 성능 Face Recognition (인식)LightCNN EER 15 % 10.38 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2018.01.02 데이터 최초 개방 구축목적
- 연구 목적으로 활용되는 얼굴 데이터베이스는 대부분 해외에서 구축됨에 따라, 한국인 대상의 인공지능 기반 안면응용기술 개발에는 어려움이 있음
- 따라서, 한국에 실적용 가능한 기술 개발을 위해서는 한국인들의 얼굴 특성에 맞는 한국형 얼굴 데이터베이스가 필요함
- 이에 본 데이터 구축은 한국인 얼굴의 통계적 특징을 파악하기 위함을 목적으로 함
활용분야
산업분야
- 한국인 안면 이미지의 기계학습을 통한 얼굴인식기술의 고도화로 모바일 금융보안서비스, 출입보안시스템, 범죄용의자 탐색시스템, 매장방문 고객지원 서비스 등 얼굴인식기반 서비스의 고도화에 활용 가능
- 한국인 안면 이미지의 기계학습을 통한 한국인 얼굴생성모델의 개발로 사용자 맞춤형 아바타 제작 서비스, 가상 영상 제작 서비스의 고도화에 활용 가능
연구분야
- 얼굴 탐지(Detection), 얼굴 복원(Restoration), 얼굴 인식(Recognition), 얼굴 생성 및 변환(Generation & Translation) 기술의 고도화, 효율화, 일반화 연구 가능
- 가짜 얼굴 판별을 위한 실제 얼굴 이미지의 통계 분석용으로 활용 가능
- 영상 내 인물 중심의 영상 편집 기술 (포즈, 조명 자동 변경 등) 고도화에 활용 가능
사례
- AI R&D 챌린지에 가짜 얼굴 판별 대회에서 학습 데이터용으로 활용
- 경찰청 범죄자 신원인식기 성능 고도화에 활용
구축량
- 공개수량 : 1,000명 (19년도 600명, 18년도 400명)
포함내용 :
- 각도 (20 views)
- 조도 (30 lightings)
- 가림 (안경 등 6종)
- 표정 (3개 표정)
- 해상도 (3개 해상도)
대표 도면
<이미지 분야 한국인 얼굴 이미지 데이터베이스 구조 이미지 예시>
<이미지 분야 한국인 얼굴 이미지 데이터베이스 구조 이미지 예시>
필요성
- 해외 주요국가에서는 시각지능 분야에서 인공지능(AI) 기술개발을 위한 기계학습 데이터 구축 등 관련 인프라를 확보하여 개방
- 국내 인공지능 기술의 활성화를 위해서는 무엇보다 기계학습에 활용할 다양한 패턴의 고품질 이미지 데이터 확보가 중요
- 현재까지 대규모 얼굴 영상 데이터베이스는 국외 연구기관에서 주도적으로 구축한 사례들이 존재하나, 대부분 서양인 위주의 얼굴 영상을 포함하고 있어서 한국인 특성에 맞는 신원확인 기술 및 얼굴 관련 응용 기술에 대한 성능 최적화 등에 어려움 존재
- 기계학습 기반의 안면 응용 기술의 발전을 위해서는 대규모의 정제되고, 색인된 안면 이미지 데이터셋이 반드시 필요한 실정이며, 기술 고도화를 위해서는 다양한 환경이 고려된 데이터셋이 필요
구축내용
- 한국인 얼굴에 대한 국내 특화 시각지능기술 및 서비스 개발을 위해 필요한 이미지 데이터의 제작, 수집, 분류 체계를 마련하고 관련 정보를 레이블링
- 얼굴 데이터의 실효성 제고를 위해 각도 20종, 조도 30종, 가림 6종, 표정 3종, 해상도 3종을 반영한 1,000명(인당 약 3만장)의 안면 이미지 데이터 제작
데이터 구조
- 얼굴 이미지 데이터베이스의 구조는 영상 해상도, ID, 액세서리 유무, 조명 위치 및 세기, 표정, 포즈 방향을 고려하여 설계되어 있음. 파일명은 영상 해상도 별로 “ID_액세서리속성_조명속성_표정속성_포즈속성.jpg“으로 구분하며 각 파일 당 얼굴 영역 정보를 텍스트 파일로 별도 저장함.
- 파일 저장시의 각 요소별 Label 정보는 다음과 같음
1. 포즈 20종 (C1 ~ C20)
2. 조명 30종 (L1 ~ L30)
3. 액세서리 6종 (S001 ~ S006)
4. 표정 3종 (E01 ~ E03)데이터 구조-Expression Expression E01 무표정 E02 활짝웃음 E03 찡그림
<이미지 분야 한국인 얼굴 이미지 데이터베이스 Label 정보>
-
데이터셋 구축 담당자
수행기관(주관) : 한국과학기술연구원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 조정현 02-958-6650 [email protected] · 데이터 설계, 검수 및 제작 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜휴먼ICT · 데이터 획득, 정제 및 색인 ㈜SQI소프트 · 시범서비스 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 조정현(한국과학기술연구원) 02-958-6650
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.