-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3.1 2024-06-30 추가 고용량 정밀영상(SIMI) 데이터 제공 별도 신청을 통해 오프라인 방식으로 직접 제공 1.3 2024-01-19 원천데이터 수정 1.2 2022-11-04 원천데이터 수정 1.1 2022-10-19 원천데이터 수정 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-13 담당자 이메일 수정 2022-07-29 콘텐츠 최초 등록 소개
다양한 장르(발레, 재즈댄스, 뮤지컬댄스, 힙합, 스트릿댄스, 라인댄스, 탭댄스, 댄스스포츠, 민속무용, 현대무용, 한국무용, 방송댄스)의 춤사위 동작을 8개의 카메라로 동시에 촬영하여, 동작이미지, 영상, skelton 정보, 동작 정보와 신체정보 데이터 구축
구축목적
춤사위 동작 분석 및 다양한 응용서비스 적용 목적의 AI학습을 위한 데이터셋
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 비디오 , 이미지 데이터 형식 JPG, MP4 데이터 출처 8개의 카메라로 스튜디오에서 직접 시연을 촬영하여 구축 라벨링 유형 키포인트(이미지), 신체동작 라벨링 형식 CVS, JSON 데이터 활용 서비스 비대면 교육, 동작일치도 분석 및 평가 등의 응용서비스 활용 가능 데이터 구축년도/
데이터 구축량2021년/약 356,000건의 동작클립(약 195,084,000장의 이미지) -
구축 규모
- 12개 무용 분야 전문가가 선정한 총 655개의 동작으로 원시데이터 총 3,744시간의 데이터 구축하여 학습용 데이터1,806시간 제공.
– 동작 목표 데이터 jpg파일(30fps) 162,000,000장
– 최종 제출 이미지 데이터 : 195,084,000장
– 모든 이미지 파일에 대한 keypoint 데이터 정보 csv파일 356,000건
– 동작 영상 mp4파일 356,000건구축 규모 구분 성과목표 구축실적 달성율 (052) 다양한 장르의 춤사위 동작 발레 130시간 139.8시간 107.50% 재즈댄스 100시간 148.8시간 148.80% 뮤지컬댄스 145시간 224.1시간 154.50% 힙합 100시간 109.7시간 109.70% 스트릿댄스 145시간 205.8시간 141.90% 라인댄스 120시간 123.6시간 103% 탭댄스 120시간 160.8시간 134% 댄스스포츠 130시간 96.7시간 74.30% 민속무용 120시간 138.1시간 115% 현대무용 130시간 125.7시간 96.60% 한국무용 130시간 187.8시간 144.40% 방송댄스 130시간 144.8시간 111.30% 전체 1,500시간 1,806시간 120.40% 학습모델 PoseC3D Top-k-accuracy 분야별 목표치 70% 이상 Body Part Embedding Similarity Score - (BPE)
- 12개 무용 분야 전문가가 선정한 총 655개의 동작으로 원시데이터 총 3,744시간의 데이터 구축하여 학습용 데이터1,806시간 제공.
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 춤사위 동작 분류 Video Classification PoseC3D AccuracyTop-2 70 % 96.99 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 소개
2. 구축내용
- 12개 무용 분야 전문가가 선정한 총 655개의 동작으로 원시데이터를 제작하여, 학습용 데이터 약 1,806시간 제공.
– 동작 목표 데이터 jpg파일(30fps)
– 최종 제출 이미지 데이터
– 모든 이미지 파일에 대한 keypoint 데이터 정보 csv파일
– 동작 영상 mp4파일
3. 대표도면
4. 데이터 포맷
- 데이터 포맷의 구분
4. 데이터 포맷 데이터 포맷의 구분 동작 이미지 데이터 Key point 데이터 동작 영상 데이터 영상 라벨링 데이터 초당 30 fps의 jpg파일 각 JPG 파일마다
Skeleton keypoint정보
.csv 파일각 동작마다
8개의 카메라
.mp4파일각 영상에 대한
동작명, 신체정보
.json 파일
– 동작 이미지 데이터는 수집 시 초당 30fps의 jpg 로 수집된 데이터를 의미
– KeyPoint 데이터는 정제 단계에서 모든 .jpg 파일에 대하여 Skeleton 좌표를 생성 저장하여 .csv로 변환한 데이터를 의미
– 동작 영상 데이터는 동작마다 카메라 방향별로 8개씩 생성된 영상 파일을 의미하며, .MP4의 형태로 구축
– 영상 라벨링 데이터는 ‘<영상데이터정보> + <어노테이션정보>[“sample명”:“sample내용”]의 구조이며, JSON 형식으로 제공
– 영상 라벨링 데이터정보데이터 포맷의 구분 영상 라벨링 데이터정보 구분 항목명 내용 영상데이터정보 video_path 동영상 경로 (파일 이름 포함) video_name 동영상 파일 이름 video_duration 동영상 길이(초) 시연자 정보 video_type 동영상 타입 (.mp4) actor_level 동작 시연자의 숙련도 actor_height 동작 시연자의 키 actor_gender 동작 시연자의 성별 actor_age 동작 시연자의 만 나이
– 어노테이션정보(라벨링 정보를 포함한 가공데이터)인 1개의 JSON은 1개 이상의 어노테이션정보를 포함데이터 포맷의 구분 어노테이션정보 구분 항목명 내용 동작 정보 annotation_no 동작 라벨링 순번 start_time 구간 시작 시간(초) end_time 구간 종료 시간(초) start_frame 구간 시작 프레임 end_frame 구간 종료 프레임 카테고리 motion_category1 동작 대분류 motion_category2 동작 중분류 motion_category3 동작 소분류 motion_category4 세부 동작 명
5. 어노테이션 포맷
5. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 1 video_path String Y 동영상 경로 2 video_name String Y mp4 파일 이름 3 video_duration Integer Y 동영상 길이(초) 4 video_type String Y 동영상 타입 mp4 5 annotations Object List Y 동작 정보 리스트 5-1 annotation_no Integer Y 동작 라벨링 순번 5-2 start_time Float Y 구간 시작 시간(초) 5-3 end_time Float Y 구간 종료 시간(초) 5-4 start_frame Integer Y 구간 시작 프레임 5-5 end_frame Integer Y 구간 종료 프레임 5-6 motion_category1 String Y 동작 대분류 5-7 motion_category2 String Y 동작 중분류 5-8 motion_category3 String Y 동작 소분류 5-9 motion_category4 String Y 세부 동작 명 6 actor Object Y 동작 시연자 정보 6-1 actor_level Integer Y 시연자의 숙련도 6-2 actor_height Float Y 시연자의 키 6-3 actor_gender Integer Y 시연자의 성별 6-4 actor_age Integer Y 시연자의 만 나이 - 12개 무용 분야 전문가가 선정한 총 655개의 동작으로 원시데이터를 제작하여, 학습용 데이터 약 1,806시간 제공.
-
데이터셋 구축 담당자
수행기관(주관) : ㈜이루온아이앤에스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김혜선 부장 070-4489-1085 [email protected] · 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜이랜서 · 크라우드 워커 및 데이터 관리 ㈜아이싸이랩 · 프로그램 개발 및 관리 행복한상상(주) · 무용 컨텐츠 제공 대한택견회 · 택견 컨덴츠 제공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김혜선 부장 070-4489-1085 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.