-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-13 데이터 최종 개방 1.0 2023-07-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-08-08 데이터설명서, 구축업체정보 수정 2023-12-29 산출물 전체 공개 소개
ㅇ한국인 얼굴에 대하여 360도 카메라, 핸드헬드 카메라 등을 이용하여 남녀 각각 265명 씩, 얼굴 표정 26종 3D 스캐닝 데이터 수집 및 인 공지능 데이터셋 구축, 서비스 모델 개발 및 실증 (연령별, 체지방을 고려한 얼굴 스캐닝 데이터)
구축목적
K-가상 아바타, AI 에이전트, 패션 디자인, 인체공학 산업 분야 등에 적용, 영화, 게임, 증강/가상 현실 콘텐츠 등 다양한 3D 미디어 제작에 활용, 3D 인체 형상, 연령별 3차원형상과 치수데이터, 표준체형, 체형분석 자료제공, Size Korea의 산업체의 인간공학적 제품 설계를 위한 동작 관련 항목 제공
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 3D , 이미지 , 텍스트 데이터 형식 obj, png 데이터 출처 자체 수집 라벨링 유형 키포인트 라벨링 형식 json 데이터 활용 서비스 K-가상 아바타, AI 에이전트, 패션 디자인, 인체공학 산업 분야 등 데이터 구축년도/
데이터 구축량2022년/얼굴: 13,780 -
데이터 구축 규모
데이터 구축 규모 구분 데이터 구축 세부내용 구축수량 데이터 설명 데이터포맷 목표 실적 원시데이터 얼굴 2D raw 이미지 jpg, raw 551,200 장 551,200 장 얼굴 3D raw 데이터 obj, png 13,780 set 13,780 set 원천데이터 얼굴 3D 모델 가공 OBJ 13,780 장 13,780 장 얼굴 3D 모델 매쉬+텍스처 OBJ,GLTF 13,780 장 13,780 장 라벨링데이터 얼굴 데이터 JSON 13,780 장 13,780 장 데이터 분포
데이터 분포 항목 과제 구분 구분 비율(%) 설명 BMI 공통 저체중 15.47 촬영 시 해당 정보 입력 (18.5 미만) 정상체중 41.69 (18.5~25.0 미만) 비만 1단계 25.47 (25.0~30.0 미만) 비만 2단계 15.09 (30.0~40.0 미만) 비만 3단계 2.26 (40.0 이상) 성별 공통 남자 50 촬영시 해당 정보 입력 여자 50 연령대 공통 20~24세(만) 22.64 촬영 시 해당 정보 입력 25~29세(만) 22.64 30~34세(만) 18.86 35~39세(만) 16.98 40~49세(만) 11.32 50~59세(만) 7.54 얼굴 표정 얼굴데이터 26가지 표정 각 3.84 촬영시 해당 정보 입력 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드① 3차원 얼굴 재구성 모델
- (개발 목표) 다양한 표정과 각도의 이미지를 학습시키고 이로부터 3차원 얼굴 재구성 결과를 추론
- (개발 내용) 구축되는 학습데이터를 활용하여 DECA 모델을 기반으로 2차원 이미지에서 얼굴의 표정과 shape, 랜드마크를 예측하고 이로부터 3차원 얼굴 재구성이 가능하도록 함
개인별 세부 매개변수와 일반 표현식 매개변수로 구성된 저차원 잠재 표현에서 UV 맵을 생성하도록 학습하면서, 회귀모델은 개인 특이적인 세부사항 및 형태, 표정, 반사계수, 조도 등을 단일 이미지에서 예측하도록 학습
그림 3차원 얼굴 재구성 모델의 구조
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 3차원 얼굴 재구성 및 변환 성능 Image Synthesis DECA Reconstruction error 2.8 단위없음 2.66 단위없음
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드ㅇ남, 여의 얼굴 26종(무표정 포함)의 3D 스캐닝 데이터 수집 및 인공지능데이터셋 구축, 서비스 모델 개발 및 실증
표 [한국인 3D 스캐닝 얼굴 데이터 구축 단계별 데이터 포맷]
한국인 3D 스캐닝 얼굴 데이터 구축 단계별 데이터 포맷] 순번 구축 생성 데이터 포맷 단계 데이터 속성명 속성설명 데이터 필수 예시 타입 여부 1 획득 원시 얼굴 3D 모델링 데이터 obj 필수 5015F_BD_A_MS 5015F_BD_A_IMG_001 2D 이미지 데이터 jpg.raw 5015F_BD_A_TT Texture 데이터 png 5015F_MD_CP 메타정보 데이터 txt 5015F_ND_MI 2 정제 원천 얼굴 Model obj 필수 5021F_FC_A Texture png 5021F_FC_A 3 라벨링 학습 얼굴 랜드마크 좌표 json 필수 1018M_FC_H 한국인 3D 스캐닝 얼굴 데이터 구축 단계별 데이터 포맷 예시 데이터 항목 Json 형식(예시) 2D 이미지
(얼굴)BMI {"category": {"type": "Face", "type_id": 2}, "annotation": {"id": "1001M_A", "num_landmarks": 68}, "landmarks": [{"id": 0, "name": 0, "x": -7.273666, "y": 17.690044, "z": 5.507403}, {"id": 1, "name": 1, "x": -7.217753, "y": 15.12151, "z": 5.359302}, {"id": 2, "name": 2, "x": -6.711654, "y": 12.841558, "z": 5.282142}, {"id": 3, "name": 3, "x": -5.927686, "y": 10.819377, "z": 5.612}, {"id": 4, "name": 4, "x": -5.040936, "y": 9.414741, "z": 6.232485}, {"id": 5, "name": 5, "x": -3.928782, "y": 8.387943, "z": 7.450204}, {"id": 6, "name": 6, "x": -2.912915, "y": 7.413002, "z": 8.402602}, {"id": 7, "name": 7, "x": -1.601021, "y": 6.460771, "z": 9.083045}, {"id": 8, "name": 8, "x": 0.127572, "y": 6.112019, "z": 9.223217}, {"id": 9, "name": 9, "x": 1.913976, "y": 6.357914, "z": 9.141863}, {"id": 10, "name": 10, "x": 3.264198, "y": 7.320491, "z": 8.5307}, {"id": 11, "name": 11, "x": 4.281546, "y": 8.372797, "z": 7.685335}, {"id": 12, "name": 12, "x": 5.412039, "y": 9.498559, "z": 6.634296}, {"id": 13, "name": 13, "x": 6.316054, "y": 10.980541, "z": 6.188167}, {"id": 14, "name": 14, "x": 7.015546, "y": 13.14329, "z": 6.034132}, 성별 연령대 얼굴 표정 3D 이미지
(얼굴)얼굴
: 26가지 표정 A~Z라벨링
(얼굴)어노테이션 포맷
- 얼굴어노테이션 포맷 항목 세부항목 값 형태 설명 categories type String “Face” type_id Number 1=Person, 2=Face annotations id Number 각 annotation3d 마다 고유의 ID 할당 3d num_landmarks Number 랜드마크 포인트 갯수 key point id array 키포인트 번호 name array options x,y,z array 키포인트 순서 (x, y, z) 값 위치를 표현 mesh mesh_id Number 각 Mesh 마다 고유의 ID 할당 actor_id Number 해당 Mesh의 배우 ID expression_id Number 해당 Mesh와 매칭되는 표정의 번호 obj_file_name String OBJ 매쉬 파일 이름 map_file_name String PNG 텍스쳐 파일이름 actors id Number 각 배우 고유의 ID 할당 sex String male : 남성 female : 여성 age Number 배우의 나이 BMI Class String 배우의 BMI 정보 expressions id Number 각 표정의 고유 번호 할당 0=무표정, 0부터 25까지 name String 표정의 이름 licenses id Number 각 라이센스 고유의 ID 할당 name String 라이센스 이름 url String 라이센스 참조 url 정보 Camera filename String 카메라 정보 파일명 info version Number 학습 데이터 버전 description String 학습 데이터 이름 year String 학습 데이터 수집 연도 contributor String 학습 데이터 제공자 url String 학습 데이터 참조 URL data_created String 학습 데이터 생성 날짜 -
데이터셋 구축 담당자
수행기관(주관) : ㈜스피어AX
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 문영민 053-792-3031 [email protected] 정제 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜위딧 수집 ㈜스피어AX 정제 ㈜비전21테크 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 문영민 053-792-3031 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.