한국인 전신 형상 및 치수 측정 데이터(성인)
- 분야영상이미지
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2023-07-06 라벨링데이터 추가 개방 1.1 2023-06-28 원천데이터, 라벨링데이터 추가 개방 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-10 활용 AI 모델 및 코드 내용 수정 2022-10-20 신규 샘플데이터 개방 2022-07-28 콘텐츠 최초 등록 소개
인공지능 학습용 데이터 구축을 위한 ‘한국인 전신 형상의 2D, 3D 데이터 취득 및 치수 측정’ 데이터의 원천데이터를 획득하여 AI 학습용 데이터로 정제, 가공하여 공개하는 것을 목표로 함
구축목적
국내 데이터 모델 부재에 따른 구축 필요, 한국인 인체형상 특성을 고려한 제품 및 서비스 분석을 위한 인공지능 기반 치수 자동 추정을 위해 한국인 표준 규격에 부합하여 산업 표준에 활용될 수 있는 형태로 구축
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg, csv 데이터 출처 직접 촬영 라벨링 유형 세그멘테이션 라벨링 형식 JSON 데이터 활용 서비스 A.I. 기반 신체 치수 측정, 맞춤 옷 서비스 데이터 구축년도/
데이터 구축량2021년/이미지 1,000,000장/신체 치수 데이터 1,000세트 -
1. 데이터 구축 규모
1. 데이터 구축 규모 원천데이터 2D Data
- 데이터 포맷 : jpg
해상도 : 1960 X 2940
총수량 : 1,000,000장 이상
3D Data
- 데이터 포맷 및 획득 수량
. mesh (obj / mtl / jpg) : 각 1,000개
. point cloud (ply) : 1,000개
총 획득 수량
. 3D 파일 : 1,000세트
신체 치수 실측 데이터
- 데이터 포맷 : CSV
모델 유형(성별, 연령 등)
신체 정보 기록(키, 몸무게 포함 36개 항목)
- 총수량 : 1,000개 (36,000개의 치수 정보)가공 및
정제 데이터가공 결과 데이터
- 데이터 포맷 : JSON
- 총수량 : 1,000,000개 이상2. 데이터 구축 분포
2. 데이터 구축 분포 남자 20~29세 30~39세 40~49세 50~59세 60세 이상 총계 중앙값 신장(cm) 173.5 172.1 169.1 165.95 164.4 - 하한 166.8 164.9 161.9 159 157.8 상한 180.5 179.5 176.6 174.2 170.6 중앙값 몸무게(kg) 69.4 72.7 70.6 68.8 67.1 하한 59.4 61.2 58.9 57.8 55.5 상한 84.4 87.1 84.6 79.8 76 조사인원(명) 95 95 110 114 86 500 비중 19% 19% 22% 22.80% 17.20% 1) 2개 적합 80% (명) 68 68 80 83 101 400 2) 1개 적합 15% (명) 13 13 15 15 19 75 3) 그 외 5% (명) 4 5 5 5 6 25 여자 20~29세 30~39세 40~49세 50~59세 60세 이상 총계 중앙값 신장(cm) 160.5 159.5 156.6 154.7 152.3 - 하한 153.5 152.8 150.5 148.1 146.1 상한 167 166.5 163 161 159 중앙값 몸무게(kg) 52.2 54.9 56.7 58.3 57.3 하한 45.6 47.4 47.5 50 48.7 상한 61.7 66.1 66.4 68.3 69 조사인원(명) 88 90 111 117 94 500 비중 17.60% 18% 22.20% 23.40% 18.80% 100 1) 2개 적합 80% (명) 60 64 76 80 120 400 2) 1개 적합 15% (명) 11 12 14 15 23 75 3) 그 외 5% (명) 3 4 6 5 7 25 2. 데이터 구축 분포 레벨 분류 비중 대분류 성별 남자 500명 (50%) 여자 500명 (50%) 중분류 연령 20 ~ 29 세 (18.3%) 30 ~ 39 세 (18.5%) 40 ~ 49 세 (22.1%) 50 ~ 59 세 (23.1%) 60세 이상 (18.0%) 소분류 복장 측정복 (17%) 춘추복 (33%) 하복 (33%) 동복 (17%) -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델학습
1. 신체 부위 세그멘테이션
- 한국인 전신 형상을 촬영한 이미지에 사람의 신체 부위에 대한 세그멘테이션을 수행하는 인공지능 학습 모델 개발
- 데이터를 학습(train), 검증(validation), 시험(test)용으로 8:1:1 비율로 나누고, 데이터 분포 특성을 확인하여, 데이터셋의 편향이 없는 학습 및 검증 수행
- 구축된 데이터를 이용한 학습 수행 및 추론 기능 개발
- 학습 및 추론 수행에 대한 지표(metric) 및 정확도 출력 기능 개발
- 상기 명시한 인공지능 학습 모델로 본사업에서 구축한 데이터들을 대상으로 학습 과정 수행
- 모델 성능 지표 mloU(mean lntersection over Union) 50% 달성할 수 있도록 유효성 검증 및 성능 개선 수행
- 인공지능 학습 모델 선정
신체 부위 세그멘테이션을 위한 인공지능 학습 모델은 ResNet과 Edge-detection을 결합한 CE2P(Context Embedding with Edge Perceiving) 알고리즘(Tao Ruan et.al, 2019)을 적용
[CE2P 모델 네트워크 구성도] - 모델 학습 수행
CE2P 모델 학습은 라벨링 수준에 따라 2단계로 구분하여 수행. 1단계 학습은 전체 신체 부위에 대한 라벨링이 수행된 자료를 사용하였으며, 2단계 학습은 카메라의 위치에 따라 부분적으로 라벨링을 수행한 이미지를 적용. 2단계 학습은 1단계 학습을 통해 도출된 학습 결과 weight를 pre-trained model로 적용하는 전이 학습 기법을 적용.
[학습 진행 과정 예시]
- 인공지능 학습 모델 선정
2. 인체 3D 골격추정
모델학습 연구개발 내용 연구개발 범위 인체 골격 추정 방법론 2D 영상에 획득된 사람의 골격을 3D로 추론하는 기술 리깅 및 리타겟팅 기술 리깅된 인체 모델에 획득된 모션으로 리타겟팅하는 기술 응용 시나리오 탐색 메타버스 응용을 위한 선행 기술 조사 및 데모 시연 - 딥러닝 기반 인체 자세 / 골격 추정 방법론 조사
- 딥러닝 기반 3D 골격 추정 및 리타겟팅 응용 연구
- OpenPose 기반 2D 관절점으로 3D Adam 골격 모델 추정
- 추정된 골격 모델을 복원된 외형 템플릿에 적용. 리타겟팅 코드를 공개함.
- 다양한 응용 시나리오 적용을 위해 본 연구의 오픈 소스를 활용함
- 딥러닝 기반 3D 골격 추정 및 리타겟팅 응용 연구
- 딥러닝 기반 인체자세/골격추정 기술 분석
- 딥러닝 기반 2D 관절점 추정 기술 (OpenPose)
- 인체의 2D 관절점과 관절점 간의 친화도를 학습하는 네트워크 설계 제안
- 다중 인체 객체를 동시에 검출하여 처리 속도가 빠름. 실시간 수행 가능.
- 딥러닝 기반 3D 관절점 추정으로 확장 (Monocular Total Capture)
- 2D 영상에서 3D 골격 좌표를 추정하는 방법론이 성공적으로 제시됨.
- Part Affinity Fields (PAFs) 모듈 성능 확인. 3D 에 대해서도 적용.
- 데이터 부족으로 인한 성능 저하를 극복하기 위해 모델 정합 및 추적 기술 활용.
- 추정된 골격 좌표를 Adam 모델에 적용하여 인체 외형을 변형.
- 딥러닝 기반 2D 관절점 추정 기술 (OpenPose)
- 골격좌표를 적용하여 아바타를 변형하는 기술
- Monocular Total Capture 의 오픈 소스를 개발하여 응용 시나리오별 테스트 진행
-
모델 학습은 학습 과정 확인을 위해 개발된 python code를 jupyter notebook에 import하여 적용하였으며, jupyter notebook 파일은 성과품에 포함하여 별도로 제출
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 신체 치수 예측 Image Classification ConvMath_ViT MAPE 80 % 99.96 % 2 신체 주요부위 추정(Human Parsing) Image Classification CE2P mIoU 50 % 66.84 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
1. 데이터 포맷 2D 이미지 데이터 JPG 어노테이션 파일 JSON 1. 데이터 포맷 데이터 종류 3D 메쉬 텍스처 포인트 클라우드 (Mesh) (Texture) (PointCloud) 예시 데이터 포맷 .obj .jpg .ply 데이터 사양 3M Polygon 이상 4,096 * 4,096 pixel 50K point 이상 2. 데이터 구성
- 데이터 -- 1.Training -- ┌ [라벨링데이터]
│ │ ├[Model]
│ │ │ └ [json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ .
│ └ [원천데이터]
│ ├ [Model]
│ │ ├ [csv]
│ . │ └ [Model.csv]
│ . └ [Image]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ .
2.Validation -- ┌ [라벨링데이터]
│ │ ├[Model]
│ │ │ └ [json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ .
│ └ [원천데이터]
│ ├ [Model]
│ │ ├ [csv]
│ . │ └ [Model.csv]
│ . └ [Image]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ .
3.Test ------ ┌ [라벨링데이터]
│ │ ├[Model]
│ │ │ └ [json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ . ├ [Action_Cloth_CameraNumber.json]
│ │ .
│ └ [원천데이터]
│ ├ [Model]
│ │ ├ [csv]
│ . │ └ [Model.csv]
│ . └ [Image]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ ├ [Action_Cloth_CameraNumber.jpg]
│ .
4.Sample ---- ┌ [라벨링데이터]
│ ├[Model]
│ │ └ [json]
│ . ├ [Action_Cloth_CameraNumber.json]
│ . ├ [Action_Cloth_CameraNumber.json]
│ .
└ [원천데이터]
├ [Model]
│ ├ [csv]
. │ └ [Model.csv]
. └ [Image]
├ [Action_Cloth_CameraNumber.jpg]
├ [Action_Cloth_CameraNumber.jpg]
2. 데이터 구성 항목 설명 [name] · 폴더이름 Action_Cloth_CameraNumber.json · 어노테이션 정보가 있는 json 파일
· Action : 01~06 총 6가지 자세
01(차렷), 02(A자), 03(T자),
04(손 펴서 팔 직각 들기), 05(앞으로 나란히), 06(걷기),
· Cloth : 측정복, 춘추복, 하복, 동복 총 4개의 복장
01(측정복), 02(춘추복1), 03(춘추복2)
04(하복1), 05(하복2), 06(동복)
· CameraNumber : 01 ~ 32까지의 카메라 넘버Action_Cloth_CameraNumber.jpg · 정제처리가 된 image 파일
· Action : 01~06 총 6가지 자세
01(차렷), 02(A자), 03(T자),
04(손 펴서 팔 직각 들기), 05(앞으로 나란히), 06(걷기),
· Cloth : 측정복, 춘추복, 하복, 동복 총 4개의 복장
01(측정복), 02(춘추복1), 03(춘추복2)
04(하복1), 05(하복2), 06(동복)
· CameraNumber : 01 ~ 32까지의 카메라 넘버Model.csv · 모델의 신체치수 측정 데이터
F : 여자
M : 남자
번호 : 모델의 고유번호
3. 어노테이션 포맷
3. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 inspRejectYn String N 검수현황값 2 labelingInfo Object Y 객체별 어노테이션 데이터 비고정 키값 02월 01일 labelingInfo[].color String Y 객체 표시 색 02월 02일 labelingInfo[].location String Y 폴리곤 위치 값 02월 03일 labelingInfo[].label String Y 객체 이름 02월 04일 labelingInfo[].type String Y 라벨링 타입 ‘polygon’ 3 images Object 03월 01일 identifier String Y 파일명 03월 02일 dateTime String Y 촬영일자 03월 03일 fileFormat String Y 파일 형식(포맷) 03월 04일 imgSize String Y 이미지 파일 크기 03월 05일 imgPhotographer String 촬영자 03월 06일 device String 카메라 장비정보 03월 07일 imgLocation String 촬영위치 03월 08일 copyRight String 저작권 정보 03월 09일 resolution String Y 해상도 03월 10일 colorDepth Number 컬러깊이 03월 11일 ISO Number ISO감도 03월 12일 definition String 선명도 03월 13일 whiteBalance Number 화이트 밸런스 03월 14일 exposureTime Number 노출시간 03월 15일 exposureMode String 노출모드 03월 16일 F-Stop Number 조리개 값 03월 17일 flash String 플래시 사용여부 03월 18일 filter String 필터 03월 19일 focalLength Number 초점거리 03월 20일 fieldOfView Number 시야각(화각) 03월 21일 angle Number 촬영각도 03월 22일 GPS Object GPS정보 03월 23일 weather String 날씨 4 bodyinfo Object 모델 정보 04월 01일 bodyinfo.sex String Y 성별 04월 02일 bodyinfo.age Number Y 나이 5 position String Y 모델 자세 6 cloth String Y 복장 7 camera_number Number Y 카메라 넘버 4. 실제 예시
- 데이터 -- 1.Training -- ┌ [라벨링데이터]
-
데이터셋 구축 담당자
수행기관(주관) : ㈜위지윅스튜디오
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 고태윤 02-749-0507 [email protected] · 사업총괄 및 데이터 정제 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜이오이스 · 데이터 수집 ㈜메트릭스 · 데이터 가공 ㈜미소정보기술 · 저작도구 ㈜에어패스 · 데이터 활용
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.