-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.4 2024-06-17 원천데이터 추가 개방 1.3 2023-10-17 원천데이터 수정 1.2 2022-11-04 원천데이터 수정 1.1 2022-10-19 원천데이터 수정 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-13 담당자 이메일 수정 2022-07-28 콘텐츠 최초 등록 소개
격투스포츠[택견]의 동작을 8개의 카메라로 동시에 촬영하여 데이터 제작
구축목적
택견 동작 분석 및 다양한 응용서비스 적용 목적의 AI학습을 위한 데이터셋
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 비디오 데이터 형식 JPG, MP4 데이터 출처 8개의 카메라로 스튜디오에서 직접 시연을 촬영하여 구축 라벨링 유형 키포인트(이미지), 신체동작 라벨링 형식 CVS, JSON 데이터 활용 서비스 비대면 교육, 동작일치도 분석 및 평가 등의 응용서비스 활용 가능 데이터 구축년도/
데이터 구축량2021년/약 117,800건의 동작클립(약 100,844,000장의 이미지) -
구축 규모
택견분야 전문가가 선정한 36개의 동작으로 총 1,146시간의 원시데이터를 구축하여 900시간의 학습용 데이터 제공
- 동작 목표 데이터 jpg파일(30fps) 약 162,000,000장
- 최종 제출 이미지 데이터 : 약 100,084,000장
- 모든 이미지 파일에 대한 keypoint 데이터 정보 csv파일 약 118,000건
- 동작 영상 mp4파일 약 118,000건
구분 구분 성과목표 구축실적 달성율 (051) 스포츠 영상 데이터[격투스포츠]-택견 개별구 250시간 313시간 125.20% 동작구 155시간 371시간 239.30% 응용동작 95시간 248시간 261% 전체 500시간 932시간 186.40% 학습모델 PoseC3D Top-k-accuracy 분야별 목표치 70% 이상 Body Part Embedding Similarity Score - (BPE) -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 택견 동작 분류 Video Classification PoseC3D AccuracyTop-1 70 % 78.13 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드소개
구축내용
택견분야 전문가가 선정한 36개의 동작으로 총 1,146시간의 원시데이터를 구축하여 900시간의 학습용 데이터 제공
- 동작 목표 데이터 jpg파일(30fps)
- 최종 제출 이미지 데이터
- 모든 이미지 파일에 대한 keypoint 데이터 정보 csv파일
- 동작 영상 mp4파일
대표도면
데이터 포맷
- 데이터 포맷의 구분
데이터 포맷의 구분 동작 이미지 데이터 keypoint 데이터 동작 영상 데이터 영상 라벨링 데이터 초당 30fps의 jpg 파일 각 jpg 파일마다 skeleton keypoint 정보 각 동작마다 각 영상에 대한 .csv 파일 8개의 카메라 .mp4 파일 동작명, 신체정보 .json파일 - 동작 이미지 데이터는 수집 시 초당 30fps의 jpg 로 수집된 데이터를 의미
- KeyPoint 데이터는 정제 단계에서 모든 .jpg 파일에 대하여 Skeleton 좌표를 생성 저장하여 .csv로 변환한 데이터를 의미
- 동작 영상 데이터는 동작마다 카메라 방향별로 8개씩 생성된 영상 파일을 의미하며, .MP4의 형태로 구축
- 영상 라벨링 데이터는 ‘<영상데이터정보> + <어노테이션정보>[“sample명”:“sample내용”]의 구조이며, JSON 형식으로 제공
- 영상 라벨링 데이터정보
영상 라벨링 데이터정보 구분 항목명 내용 영상데이터정보 video_path 동영상 경로 (파일 이름 포함) video_name 동영상 파일 이름 video_duration 동영상 길이(초) 시연자 정보 video_type 동영상 타입 (.mp4) actor_level 동작 시연자의 숙련도 actor_height 동작 시연자의 키 actor_gender 동작 시연자의 성별 actor_age 동작 시연자의 만 나이 - 어노테이션정보(라벨링 정보를 포함한 가공데이터)인 1개의 JSON은 1개 이상의 어노테이션정보를 포함
어노테이션정보 구분 항목명 내용 동작 정보 annotation_no 동작 라벨링 순번 start_time 구간 시작 시간(초) end_time 구간 종료 시간(초) start_frame 구간 시작 프레임 end_frame 구간 종료 프레임 카테고리 motion_category1 동작 대분류 motion_category2 동작 중분류 motion_category3 동작 소분류 motion_category4 세부 동작 명 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수여부 설명 1 video_path String Y 동영상 경로 2 video_name String Y mp4 파일 이름 3 video_duration Integer Y 동영상 길이(초) 4 video_type String Y 동영상 타입 mp4 5 annotations Object List Y 동작 정보 리스트 5–1 annotation_no Integer Y 동작 라벨링 순번 5–2 start_time Float Y 구간 시작 시간(초) 5–3 end_time Float Y 구간 종료 시간(초) 5–4 start_frame Integer Y 구간 시작 프레임 5–5 end_frame Integer Y 구간 종료 프레임 5–6 motion_category1 String Y 동작 대분류 5–7 motion_category2 String Y 동작 중분류 5–8 motion_category3 String Y 동작 소분류 5–9 motion_category4 String Y 세부 동작 명 6 actor Object Y 동작 시연자 정보 6–1 actor_level Integer Y 시연자의 숙련도 6–2 actor_height Float Y 시연자의 키 6–3 actor_gender Integer Y 시연자의 성별 6–4 actor_age Integer Y 시연자의 만 나이 -
데이터셋 구축 담당자
수행기관(주관) : ㈜이루온아이앤에스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김혜선 부장 070-4489-1085 [email protected] 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜이랜서 크라우드 워커 및 데이터 관리 ㈜아이싸이랩 프로그램 개발 및 관리 행복한상상(주) 무용 컨텐츠 제공 대한택견회 택견 컨덴츠 제공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김혜선 부장 070-4489-1085 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.