객체 폐색 데이터
- 분야영상이미지
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-01-17 데이터 최종 개방 1.0 2023-06-28 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-03-15 최종산출물 전체 공개 2023-07-03 데이터 유형 수정 소개
대상 객체의 크기를 추정하기 위한 유동적 폐색, 대상객체의 형상을 추정하기위한 일정한 폐색으로 이원화된 데이터 셋 구축
구축목적
∘ 장애물 또는 객체 간의 가려진 경우에도 정확한 객체 인식을 위한 형상 추적용 폐색 데이터를 구축 ∘ 자율주행에 활용하여 인공지능 주행속도 감속 응용서비스 개발을 지원하고, 그 외에 영상 품질 향상 기술, 객체 인식 및 추적 기술 등 전반적인 이미지 전처리 기
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 직접 촬영 라벨링 유형 유동적폐색 : 바운딩박스(이미지), 일정한 폐색 : 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 CCTV 영상 품질 향상, 이미지 전처리 기술 네트워크 학습, 객체 추척 및 인식 품질 향상, 장애물 또는 객체 간 폐색 시 정확한 객체 인식으로 인한 자율주행 주행속도 감속 응용서비스 개발 및 활용 등 데이터 구축년도/
데이터 구축량2022년/유동적 폐색 : 이미지 1,506,395건, 일정한 폐색 : 이미지 501,364건 -
1. 데이터 구축 규모
1. 데이터 구축 규모 공정 구분 단위 수량 수집 장소 종 12 영상 Clips 개 41,713 정제 유동적 폐색 frame 1,835,186 일정한 폐색 frame 518,424 중복제거 frame 2,353,610 비식별화 frame 2,353,610 가공/품질 Bounding box frame 1,506,395 Segmentation frame 501,364 2. 데이터 분포
∘ 폐색 유형별 분포2. 데이터 분포 폐색 유형 구축량(집계) 비율(집계) 유동적폐색 1,506,395 75.32% 일정한폐색 501,364 25.07% 합계 2,007,759 100.39% ∘ 유동적 폐색 비율별 분포
유동적 폐색 비율별 분포 폐색 단계 구축량(집계) 비율(집계) 0% ~ 25% 742,328 49.49% 26% ~ 50% 588,218 39.21% 50% 초과 161,092 10.74%
타겟 없음 14,757 0.98% 합계 1,506,395 100.42% ∘ 일정한 폐색 비율별 분포
일정한 폐색 비율별 분포 폐색 단계 구축량(집계) 비율(집계) 0% 18,780 3.76% 1% ~ 19% 77,560 15.51% 20% ~ 40% 106,954 21.39% 41% ~ 60% 111,345 22.27% 61% ~ 80% 109,892 21.98% 81% ~ 95% 59,278 11.86% 95% 초과 17,555 3.51% 합계 501,364 100.28% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 모델 학습
∘ 모델명 : TridentNet
∘ 항목명 : 객체 검출 및 추적
∘ 활용 AI 모델 설명 : 폐색 객체 또는 카메라 촬영 구도에 동적 변화 때문에 타깃 객체의 폐색 상황이 연출되는 유동적 폐색 환경에서 객체를 검출하고, 추적(tracking)하는 데이터셋 구성∘ 모델명 :PointRend
∘ 항목명 : 객체 추출
∘ 활용 AI 모델 설명 : 타깃 객체가 고정된 상황에서 폐색 객체의 동적 변화 때문에 폐색 상황이 연출되는 일정한 폐색 상황에서 타깃 객체의 형상을 추출하는 데이터셋 구성
2. 활용 서비스
∘ 재난현장 및 안전관리 현장에서 360도 영상을 실시간으로 촬영하면서 일부 폐색된 목표객체에 대한 검출 및 추적 기능 확보를 통하여 제품 및 작업 수행 효율 극대화 기대
∘ 재난현장에서 잔해물 사이에 있는 생존자 구조 등 해당 분야에 대한 활용 가능
∘ 본 과제를 통해 구축할 최초의 폐색 객체용 학습 데이터셋은 기존 개발된 다양한 state-of-the-art (SOTA) 인공지능 모델의 학습에 활용 가능함. 실제 환경에서 촬영된 객체 폐색 데이터셋을 이용하여 성능을 높일 수 있을 것으로 예상하며, 다양한 소비자 경험을 제공할 수 있을 것으로 기대됨. -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 설명
∘ 폐색 유형을 이원화하여 대상객체의 크기를 추정하기 위한 유동적 폐색, 대상객체의 형상을 추정하기 위한 일정한 폐색으로 시나리오를 구분
∘ 가려지는(폐색) 대상이 되는 타깃객체, 타깃객체에 대한 폐색을 유발시키는 폐색객체, 타깃객체에 대한 폐색에 영향을 주지 않는 일반객체의 3종으로 객체를 구분
∘ 유동적 폐색의 경우, 전체 대비 구축 비율은 75%로 라벨링 형태는 Bounding box 가공을 진행
∘ 일정한 폐색의 경우, 전체 대비 구축 비율은 25%로 라벨링 형태는 Segmentation 가공을 진행
∘ 객체 유형별 16개 분류와 85종의 객체에 대한 데이터 수집
∘ 수집 시점을 high, eye, low로 나누어 수집을 진행2. 데이터 포맷
∘ 원문 데이터 포맷 예시<유동형 객체 원천 데이터> <유동형 객체 라벨 데이터>
<일정한 폐색 객체 원천 데이터> <일정한 폐색 객체 라벨 데이터>
3. JSON 형식
JSON 예시
{
"Raw_Data_Info.": {
"Raw_Data_ID": "D1_221110_OSS06_L0010",
"Copyrighter": "㈜미디어그룹사람과숲",
"Location": "O",
"Target_type": "SS",
"Place": "선착장",
"Date": "2022-11-10",
"Length": "10",
"Resolution": "1920,
1080",
"FPS": "30",
"F-stop": "F2.4",
"Exposure_Time": "1/500",
"Angle": "Low",
"File_Extension": "mp4"
},
"Source_Data_Info.": {
"Source_Data_ID": "D1_221110_OSS06_L0010_0050",
"Select_time": "00:00:09:21",
"File_Extension": "jpg"
},
"Learning_Data_Info.": {
"Path":“일정한폐색_S/실외_O/프레임부분사용_S",
"File_Extension": "JSON",
"Json_Data_ID":D1_221110_OSS06_L0010_0050",
"Annotations": [
{
"Class_ID": "Car",
"Object_type": "Target_Object",
"Object_num": "0",
"Type": "Segmentation",
"Type_value": [
1021,
377,
918,
397,
...... 중략 .......
1042,
379,
1038,
379
],
"Class_size": "466080",
"Occlusion_size": "112339",
"Occlusion_rate": "0.25"
},
...... 중략 .......
}
}4. 데이터 구성
데이터 구성 Key Description Type Child Type Raw_Data_ID 원시 파일명 string Copyrighter 회사명 string Location 장소 string Target_type 폐색유형 string Place 촬영장소 ID string Date 촬영일자(yyyy-mm-dd) string Length 영상길이 초(sec) string Resolution 해상도 string FPS FPS string F-Stop 조리개 수치 string Exposure_Time 노출 시간 string Angle 촬영 각도 string File_Extension 원시 파일 확장자 string Source_Data_ID 이미지 파일명 string Select_time 추출시간 string File_Extension 이미지 확장자 string Path Json 폴더 경로 string File_Extension Json string Json_Data_ID Json 파일명 string Annotations - array Json Array Class_ID 객체 ID string Object_Type 객체유형 string Object_num Object 번호 string Type 어노테이션 종류 string Type_value 좌표 array json Array Class_size 객체크기(pixel) string Occlusion_size 폐색크기(pixel) string Occlusion_rate 폐색비율(%) string 5. 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수 설명 범위 여부 1 Raw_Data_Info. 1-1 Raw_Data_ID string Y 원시 파일명 "D1_221110_OSS06_L0010" 1-2 Copyrighter string Y ㈜미디어그룹사람과숲 "㈜미디어그룹사람과숲" 1-3 Location string Y 실내 및 실외 "I", "0" 1-4 Target_type string Y 폐색유형 "SS"(일정형 프레임 부분 사용), "DS"(유동형프레임부분사용), "DA"(유동형프레임전량사용) 1-5 Place string Y 촬영장소 ID "집" ~ "공원" 1-6 Date string Y 촬영일자 "2022-11-10" (yyyy-mm-dd) 1-7 Length string Y 영상길이 초(sec) “0” ~ "20" 1-8 Resolution string Y 해상도 "1920, 1080" 1-9 FPS string Y FPS "30" 1-10 F-Stop string Y 조리개 수치 "F1.8"~"F11" 1-11 Exposure_Time string Y 노출 시간 "1/1043"~"1/40" 1-12 Angle string Y 촬영 각도 "Low"(로우앵글), "Eye"(아이앵글), "High"(하이앵글) 1-13 File_Extension string Y 원시 파일 확장자 "mp4" 2 Source_Data_Info. 2-1 Source_Data_ID string Y 이미지 파일명 "D1_221110_OSS06_L0010_0050" 2-2 Select_time string Y 추출시간 "00:00:09:21" 2-3 File_Extension string Y 이미지 확장자 "jpg" 2-4 Learning_Data_Info. 3 Path string Y Json 폴더 경로 "일정한폐색_S/실외_O/프레임부분사용_S" 3-1 File_Extension string Y Json "JSON" 3-2 Json_Data_ID string Y Json 파일명 "D1_221110_OSS06_L0010_0050" 3-3 Annotations array Y - [ ] 3-4 Class_ID string Y 객체 ID "Car" 3-5 Object_Type string Y 객체유형 "Target_Object", "Occlusion_Object“ ”Normal_Object“ 3-6 Object_num string Y Object 번호 "0" ~ "99" 3-7 Type string Y 어노테이션 종류 "Segmentation", "Bounding_box" 3-8 Type_value array Y [x,y, x,y, ..] [1021, 377, 918, 397, 838, ..] 3-9 Class_size string Y 객체크기(pixel) "466080" 3-10 Occlusion_size string Y 폐색크기(pixel) "112339" 3-11 Occlusion_rate string Y 폐색비율(%) "0.0"~"0.95" -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박종범(사업총괄책임자-PM) 02-830-8583 [email protected] 사업총괄, AI 학습용 데이터 설계/구축 데이터 품질관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 링크플로우(주) ∘ 데이터 수집 및 정제 ㈜지케스 ∘ AI 학습용 데이터 가공 고려대학교 산학협력단 ∘ AI 학습용 데이터 설계 / AI 학습 모델 개발 지티원(주) ∘ AI 학습용 데이터 품질관리 주식회사 써로마인드 AI 학습용 데이터 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박종범(사업총괄책임자-PM) 02-830-8583 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.