화질 변환 영상 데이터
- 분야영상이미지
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-01-10 데이터 최종 개방 1.0 2023-07-12 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-20 샘플데이터 수정 2024-01-10 산출물 전체 공개 2023-11-03 데이터 설명서, 구축가이드, 교육동영상 공개 소개
∘ 영상 복원 연구 및 Super resolution, 전반적 객체 인식 및 분할 연구, 전반적 비전 인공지능 적용 가능 산업 등의 활용가능한 다중 화질 영상 데이터 구축
구축목적
∘ 저화질 영상을 고화질 영상으로의 복원 및 오래된 CCTV와 같은 저화질 영상 내의 객체 인식 및 분할 등을 위한 다중 화질 영상 데이터 구축
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 직접 촬영 라벨링 유형 저화질 영상 : 시멘틱 세그멘테이션(이미지) 고화질 영상 : 팬옵틱 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 Super resolution/GAN 연구, 영상 복원 연구, 강인한 영상 인식 관련 연구 또는 전반적 객체 인식 및 분할 연구, 영상기기(CCTV, 차량용 블랙박스)의 저하된 화질을 고화질로 복원 데이터 구축년도/
데이터 구축량2022년/2,104,263건 -
1. 데이터 구축 규모
데이터 구축 규모 공정 구분 단위 수량 수집 장소 종 14 영상 Clips 개 17,128 정제 중복제거 frame 2,572,229 비식별화 frame 2,572,229 가공/품질 Segmentation frame 2,104,263 2. 데이터 분포
∘ 해상도 레벨별 분포(화질 단계별 분포)2. 데이터 분포 코드 해상도 구축량(집계) 비율(집계) L01 320*240 300,609 14.30% L02 640*480 300,609 14.30% H01 1280*720 300,609 14.30% H02 1920*1080 300,609 14.30% H03 2560*1440 300,609 14.30% H04 3840*2160 300,609 14.30% H05 5120*2880 300,609 14.30% 합계 2,104,263 100.00% ∘ 촬영 장소별 분포
촬영 장소별 분포 ID 장소 구축량(집계) 비율(집계) I01 스튜디오 139,356 6.60% I02 체육관 147,245 7.00% I03 식당 126,455 6.00% I04 집 150,563 7.20% I05 카페 153,790 7.30% I06 사무실 160,447 7.60% I07 전자상가 155,351 7.40% I08 연주실 140,028 6.70% I10 가구점 148,946 7.10% O01 운동장 155,232 7.40% O02 산책로 159,705 7.60% O03 도로 및 인도 157,696 7.50% O04 광장 169,351 8.00% O05 주차장 140,098 6.70% 합계 2,104,263 100.00% ∘ 촬영 각도별 분포
촬영 각도별 분포 촬영 각도 구축량(집계) 비율(집계) High Angle 841,813 40.00% Eye Angle 856,065 40.70% Low Angle 406,385 19.30% 합계 2,104,263 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 모델 학습
∘ 모델명 : PointRend
∘ 항목명 : 객체 검출 및 추출
∘ 같은 물체, 환경을 다른 각도에서 촬영한 7종의 화질 단계 이미지에 대하여 객체의 형상을 검출하고 추출하는 데이터셋 구성< TridentNet >
∘ 모델명 : SwinIR
∘ 항목명 : 초해상화
∘ 저화질 영상 내의 객체 인식 및 분할, 추적 등을 위해 다양한 화질로 수집된 영상 내 Semantic 및 Instance Segmentation 라벨링을 통하여 저화질 영상으로부터 고화질 영상을 생성< SwinIR >
2. 활용 서비스
∘ Super resolution/GAN 연구, 영상 복원 연구, 강인한 영상 인식 관련 연구 또는 전반적 객체 인식 및 분할 연구 등에 활용될 수 있음
∘ 현재 보안에 이용되는 영상기기(CCTV, 차량용 블랙박스)의 저하된 화질을 고화질로 복원하여 강력 범죄의 중요 단서로 활용 가능 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 설명
∘ 저화질 영상을 고화질 영상으로의 복원 및 오래된 CCTV와 같은 저화질 영상 내의 객체 인식 및 분할, 추적 등을 위한 다중 화질 영상 데이터 구축
∘ 서로 다른 카메라를 이용하여 같은 물체, 환경을 7종의 화질 단계로 나누어 수집을 진행(고화질 : 5K, UHD, QHD, FHD, HD, 저화질 : VGA, QVGA)
∘ 객체 유형별 21개 분류와 111종의 객체에 대한 데이터 수집을 진행
∘ 수집 시점을 High, Eye, Low로 나누어 수집을 진행
∘ 고화질의 경우, 전체 대비 구축 비율은 71.5%로 라벨링 형태는 Instance Segmentation 가공을 진행
∘ 저화질의 경우, 전체 대비 구축 비율은 28.5%로 라벨링 형태는 Semantic Segmentation 가공을 진행
∘ 카메라의 노출 브라케팅(Bracketing) 값을 다음의 5단계로 나누어 수집을 진행2. 데이터 포맷
원문 데이터 포맷 예시2. 데이터 포맷 <저해상도 원천 데이터(4:3)> <저해상도 라벨 데이터(4:3)> <고해상도 원천 데이터(16:9)> <고해상도 라벨 데이터(16:9)> 3. JSON 형식
JSON 형식 JSON 예시 {
"Raw_Data_Info.": {
"Raw_Data_ID": "D3_220603_O03_L02A_E0001",
"Copyrighter": "㈜미디어그룹사람과숲",
"Location": "O",
"Place": "도로",
"Date": "2022-06-03",
"Resolution": "1920, 1080",
"F-stop": "F1.8",
"Exposure_Time": "1/20",
"Low_environment": "약함",
"Exposure_bracketing": "0",
"Angle": "Eye",
"File_Extension": "jpg"
},
"Source_Data_Info.": {
"Source_Data_ID": "D3_220603_O03_L02A_E0001",
"File_Extension": "jpg"
},
"Learning_Data_Info.": {
"Path": "L02_약함/브라케팅1단계_A",
"File_Extension": "JSON",
"Json_Data_ID": "D3_220603_O03_L02A_E0001",
"Annotations": [
{
"Class_ID": "Scooter",
"Object_num": "0",
"Type": "Bounding_box",
"Type_value": [
951,
456,
1265,
1050
]
}
]
}
}4. 데이터 구성
데이터 구성 Key Description Type Child Type Raw_Data_ID 원시 파일명 string Copyrighter 회사명 string Location 장소(실내,외) string Place 장소 명칭ID string Date 촬영일자 string Length 영상길이 초(sec) string Resolution 해상도 string Video_Level 화질 레벨 string FPS FPS string Device 촬영 장비 string F-Stop 조리개 수치 string Exposure_Time 노출 시간 string Angle 촬영 각도 string File_Extension 원시 파일 확장자 string Source_Data_ID 이미지 파일명 string Center_coordinate 중심 좌표 string File_Extension 이미지 확장자 string Path json 폴더 경로 string File_Extension JSON string Json_Data_ID json 파일명 string Annotations - array Json Array Class_ID 객체 ID string Object_num 객체 번호 string Type 어노테이션 유형 string Type_value 좌표 array json Array 5. 어노테이션 포맷
5. 어노테이션 포맷 구분 항목명 타입 필수 설명 범위 여부 1 Raw_Data_Info. 1-1 Raw_Data_ID string Y 원시 파일명 "D4_220714_I05_E0100_H01" 1-2 Copyrighter string Y ㈜미디어그룹사람과숲 "㈜미디어그룹사람과숲" 1-3 Location string Y 실내 및 실외 "I", "O" 1-4 Place string Y 촬영장소 ID "스튜디오" ~ "주차장" 1-5 Date string Y 촬영일자 "2022-07-14" (yyyy-mm-dd) 1-6 Length string Y 영상길이 초(sec) “0” ~ “10” 1-7 Resolution string Y 해상도 "320, 240"~"5120, 2880" 1-8 Video_Level string Y 이미지 레벨 "L01"~"L02", "H01"~"H05" 1-9 FPS string Y FPS “30” 1-10 Device string Y 수집장비 "GoProHero_10" 1-11 F-Stop string Y 조리개 수치 "F1.8"~"F11" 1-12 Exposure_Time string Y 노출시간 "1/1043"~"1/40" 1-13 Angle string Y 촬영 각도 "Low"(로우앵글), "Eye"(아이앵글), "High"(하이앵글) 1-14 File_Extension string Y 원시 파일 확장자 "mp4" 2 Source_Data_Info. 2-1 Source_Data_ID string Y 이미지 파일명 "D4_220714_I05_E0100_H01_0004" 2-2 Center_coordinate string Y 중심좌표 "160,120"~"2560,1440" 2-3 File_Extension string Y 이미지 확장자 "jpg" 3 Learning_Data_Info. 3-1 Path string Y Json 폴더 경로 실내_I//Eye//L01 3-2 File_Extension string Y Json "JSON" 3-3 Json_Data_ID string Y Json 파일명 "D4_220714_I05_E0100_H01_0004" 3-4 Annotations array Y - [] 3-5 Class_ID string Y 객체 ID "Human" 3-6 Object_num string Y Object 번호 "0" ~ "99" 3-7 Type string Y 어노테이션 종류 "Semantic_Segmentation", "Instance_Segmentation" 3-8 Type_value array Y [x,y, x,y, ..] [1,0, 0,903, 574,634, 576,0, ..] 6. 실제 예시
{
"Raw_Data_Info.": {
"Raw_Data_ID": "D4_220714_I05_E0100_H01",
"Copyrighter": "㈜미디어그룹사람과숲",
"Location": "I",
"Place": "카페",
"Date": "2022-07-14",
"Length": "10",
"Resolution": "1280, 720",
"Video_Level": "H01",
"FPS": "30",
"Device": "GoProHero_10",
"F-Stop": "F2.4",
"Exposure_Time": "1/500",
"Angle": "Eye",
"File_Extension": "mp4"
},
"Source_Data_Info.": {
"Source_Data_ID": "D4_220714_I05_E0100_H01_0004",
"Center_coordinate": "640,360",
"File_Extension": "jpg"
},
"Learning_Data_Info.": {
"Path": "E:\\Univ_korea\\221026\\학습데이터\\실내_I\\Eye\\H01",
"File_Extension": "JSON",
"Json_Data_ID": "D4_220714_I05_E0100_H01_0004",
"Annotations": [
{
"Class_ID": "Floor(In)",
"Object_num": "0",
"Type": "Instance_Segmentation",
"Type_value": [
0,
386,
0,
720,
1280,
720,
1280,
116,
997,
114,
940,
366,
230,
399,
227,
376
]
},
...... 중략 .......
]
}
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박종범(사업총괄책임자-PM) 02-830-8583 [email protected] 사업총괄, AI 학습용 데이터 설계/구축 데이터 품질관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜미디어그룹사람과숲 데이터 수집 및 정제
AI 학습용 데이터 품질관리한알음정보(주) AI 학습용 데이터 가공 고려대학교 산학협력단 AI 학습용 데이터 설계 / AI 학습 모델 개발 지티원(주) AI 학습용 데이터 품질관리 주식회사 써로마인드 AI 학습용 데이터 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박종범(사업총괄책임자-PM) 02-830-8583 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.