-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-11-15 최종 데이터 개방 1.0 2023-06-14 데이터 개방 (Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-03-20 저작도구, 저작도구 사용설명서 수정 2023-12-08 산출물 전체 공개 소개
어두운 환경에서 객체 검출 및 추출, 이미지 향상을 위한 다양한 저조도 환경(실내·실외) 인공지능 학습용 데이터셋을 구축함
구축목적
구축목적 ∘ 저조도 환경에서 발생할 수 있는 위험 상황에 대한 교통 및 방범 모니터링 시스템의 대응력 향상으로 인한 국민의 생명과 재산 보호 능력 향상 ∘ 본 과제에서는 저조도 환경에서 객체 검출 및 객체 추출을 수행하는 인공지능 모델을 학습시키는 데 사용하기 위한 데이터셋을 구축함.
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 직접 촬영 라벨링 유형 바운딩박스(이미지), 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 CCTV 영상 모니터링 개선, 야간 방범 및 경비 모니터링, 자율주행 서비스 등 데이터 구축년도/
데이터 구축량2022년/2,036,560세트 -
1. 데이터 구축 규모
1. 데이터 구축 규모 공정 구분 단위 수량 수집 저조도 환경 종 10 장소 종 10 객체 종 51 이미지 frame 2,349,625 정제 중복제거 frame 2,219,625 비식별화 frame 2,219,625 가공/품질 Bounding box frame 2,036,560 Segmentation frame 2,036,560 2. 데이터 분포
∘ 저조도 환경별 분포2. 데이터 분포∘ 저조도 환경별 분포 구분 구축량(집계) 비율(집계) 역광(L01) 139,130 6.80% 약함(L02) 252,970 12.40% 강함(L03) 145,675 7.20% 그림자(L04) 155,325 7.60% 황혼(L05) 146,860 7.20% 낮음(L06) 352,760 17.30% 부드러움(L07) 240,270 11.80% 단일(L08) 230,285 11.30% 화면(L09) 182,325 9.00% 창(L10) 190,960 9.40% 합계 2,036,560 100.00% ∘ 노출 브라케팅별 분포
2. 데이터 분포∘ 노출 브라케팅별 분포 노출 브라케팅 구축량(집계) 비율(집계) A 407,312 20.00% B 407,312 20.00% C 407,312 20.00% D 407,312 20.00% E 407,312 20.00% 합계 2,036,560 100.00% ∘ 촬영 각도별 분포
2. 데이터 분포∘ 촬영 각도별 분포 시점유형 구축량(집계) 비율(집계) High Angle 672,320 33.00% Eye Angle 865,320 42.50% Low Angle 498,920 24.50% 합계 2,036,560 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 모델 학습
1. 모델 학습 항목명 모델 측정 지표 객체 검출 성능 TridentNet mAP 객체 추출 성능 PointRend mAP ∘ 모델명 : TridentNet
∘ 항목명 : 객체 검출
∘ 활용 AI 모델 설명 : 객체 검출에 사용되는 TrdientNet은 입력받은 영상에서 특징을 추출 동일한 매개변수를 공유하고 세가지 분기로 나뉘어 각 특징을 추출함. 각 분기에서 추정된 서로 다른 스케일의 객체 정보들에 대하여 NMS (non-maximum suppression)을 통해 최종 추정함. 따라서 본 과제를 통해 구성될 저조도 환경의 입력 영상과 각 객체의 바운딩박스를 모델의 입-출력으로써 사용하여 학습을 진행함으로써 구축된 데이터의 성능을 평가함.∘ 모델명 : PointRend
∘ 항목명 : 객체 추출
∘ 활용 AI 모델 설명 : 객체 추출에 사용되는 PointRend는 입력받은 영상에서 추출한 특징맵의 분포에 따라 샘플링의 밀도를 바꾸는 PointRend기법을 사용, 기존의 객체 추출기법들에 비해 상세한 라벨링이 가능하여 객체의 경계 부분의 분류 정확도가 향상됨. 저조도 환경의 영상의 입력 데이터로 받아 각 픽셀들에 라벨링을 진행. 따라서 본 과제를 통해 구성될 세그멘테이션 라벨링 데이터를 이용하여 학습을 진행함.2. 활용 서비스
∘ 360도 웨어러블 카메라를 CCTV 사각지대를 위한 보안 용도로 활용 시, 이동하면서 촬영된 자동차(번호판 포함) 혹은 사람에 대한 정확한 식별 기능 개선으로 제품 경쟁력 및 업무효율 극대화
∘ 군부대 및 국가 기반시설의 외곽 경비에 객체 검출 및 추출 인공지능 기술을 적용하여 외곽 경비 응용 서비스 개발
∘ 최근 국외뿐만 아니라 국내에서도 활발하게 개발되고 있는 자율주행 자동차 개발에 기여할 수 있는 국내기반 저조도 환경 인공지능 학습데이터 구축, 나아가 다양한 컴퓨터 비전 분야 적용 및 성능 향상에 기여
∘ 기존 객체 검출 및 추출 인공지능 학습용 데이터셋에 비해 고도화된 국내 환경 기반의 인공지능 학습용 데이터셋의 구축으로 인한 글로벌시장 기술경쟁력 확보 및 해외 국내 영향력 증가
∘ 영상 품질 향상 기술, 객체 인식 및 추적 기술 등 전반적인 이미지 전처리 기술 네트워크 학습, CCTV 영상 품질 향상 등 기술 개발에 활용될 수 있는 인공지능 학습용 데이터 구축 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 바운딩박스 검출 성능 Object Detection TridentNet mAP 65 % 71.93 % 2 세그멘테이션 검출 성능 Object Detection PointRend mask AP 40 % 70.71 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 설명
∘ 어두운 환경에서 객체 감지 및 추정, 이미지 향상을 위한 다양한 저조도 환경(실내·실외) 데이터
∘ 라벨링 형태는 Bounding box, Segmentation 가공을 진행
∘ 객체 유형별 13개 분류와 51종의 객체에 대한 데이터 구축
∘ 다음의 10종의 저조도 환경을 정의하여 2,000,000장 이상의 이미지 데이터 구축1. 데이터 설명 구분 저조도환경 상세 L01 역광 객체 후면에 광원이 존재하여 식별이 어려운 상태 L02 약함 저조도 환경의 프레임에서 식별 가능한 광원이 두 개 이상 존재하며 객체 식별에 어려움이 있음 L03 강함 저조도 환경의 프레임에서 식별 가능한 광원이 두 개 이상 존재하며 객체 식별이 수월한 상태 L04 그림자 주간 시간대에 대상객체가 여타의 객체의 그림자에 가려진 상태 L05 황혼 일출 또는 일몰 시간대의 광원(태양)에 의하여 프레임 색감이 다소 붉은 상태 L06 낮음 프레임에서 광원이 등장하지 않으며, 프레임 바깥의 광원이 대상객체 식별에 영향을 주지 않음 L07 부드러움 프레임에서 광원이 등장하지 않지만, 프레임 바깥의 광원이 대상객체 식별에 영향을 주는 상태 L08 단일 저조도 환경의 프레임에서 식별 가능한 광원이 한 개 존재하여 객체 식별에 영향을 줌 L09 화면 실내 저조도 환경에서 모니터 광원이 식별되는 상태 L10 창 실내 저조도 환경에서 창밖의 광원이 식별되는 상태 2. 데이터 포맷
2. 데이터 포맷 구분 파일 포맷 해상도 원시데이터 JPG 1920x1080 FHD 원천데이터 JPG 1920x1080 FHD 라벨링데이터 JSON ∘ 데이터셋 예시
∘ 데이터셋 예시 예시 원천 데이터 바운딩박스 라벨링 데이터 원천 데이터 세그멘테이션 라벨링 데이터 3. JSON 형식
3. JSON 형식 바운딩박스 JSON 예시 {
"Raw_Data_Info.": {
"Raw_Data_ID": "D3_220603_O03_L02A_E0001",
"Copyrighter": "㈜미디어그룹사람과숲",
"Location": "O",
"Place": "도로",
"Date": "2022-06-03",
"Resolution": "1920, 1080",
"F-stop": "F1.8",
"Exposure_Time": "1/20",
"Low_environment": "약함",
"Exposure_bracketing": "0",
"Angle": "Eye",
"File_Extension": "jpg"
},
"Source_Data_Info.": {
"Source_Data_ID": "D3_220603_O03_L02A_E0001",
"File_Extension": "jpg"
},
"Learning_Data_Info.": {
"Path": "L02_약함/브라케팅1단계_A",
"File_Extension": "JSON",
"Json_Data_ID": "D3_220603_O03_L02A_E0001",
"Annotations": [
{
"Class_ID": "Scooter",
"Object_num": "0",
"Type": "Bounding_box",
"Type_value": [
951,
456,
1265,
1050
]
}
]
}
}4. 데이터 구성
4. 데이터 구성 Key Description Type Child Type Raw_Data_ID 원시 파일명 String Copyrighter 저작권 정보 String Location 실내 및 실외 String Place 촬영장소 ID String Date 촬영일자(yyyy-mm-dd) String Resolution 해상도 String F-Stop 조리개 수치 String Exposure_Time 노출시간 String Low_environment 저조도 환경 String Exposure_bracketing 노출 브라케팅 String Angle 촬영 각도 String File_Extension 원시 파일 확장자 String Source_Data_ID 원천 이미지 파일명 String File_Extension 원천 이미지 확장자 String Path 학습데이터 폴더 경로 String File_Extension 학습데이터 파일 확장자 String Json_Data_ID Json 파일명 String Annotations - Json Array Json Object Class_ID 객체 ID String Object_num 객체 번호 String Type 어노테이션 유형 String Type_value 어노테이션 좌표값 Json Array Json Object 5. 어노테이션 포맷
5. 어노테이션 포맷 구분 항목명 타입 필수
여부설명 범위 1 Raw_Data_Info. 1-1 Raw_Data_ID string Y 원시 파일명 "D3_221111_O03_L06A_L0048" 1-2 Copyrighter string Y ㈜미디어그룹사람과숲 "㈜미디어그룹사람과숲" 1-3 Location string Y 실내 및 실외 "I", "O" 1-4 Place string Y 촬영장소 ID "집" ~ "공원" 1-5 Date string Y 촬영일자 "2022-11-11" (yyyy-mm-dd) 1-6 Resolution string Y 해상도 "1920, 1080" 1-7 F-Stop string Y 조리개 수치 "F1.8"~"F11" 1-8 Exposure_Time string Y 노출시간 "1/1043"~"1/40" 1-9 Low_environment string Y 저조도 환경 "역광", "부드러움" .. 1-10 Exposure_bracketing string Y 노출 브라케팅 "0", "-1", "-4/3", "-5/3", "-2" 1-11 Angle string Y 촬영 각도 "Low"(로우앵글), "Eye"(아이앵글), "High"(하이앵글) 1-12 File_Extension string Y 원시 파일 확장자 "jpg" 2 Source_Data_Info. 2-1 Source_Data_ID string Y 이미지 파일명 "D3_221111_O03_L06A_L0048" 2-2 File_Extension string Y 이미지 확장자 "jpg" 3 Learning_Data_Info. 3-1 Path string Y Json 폴더 경로 "L06_낮음/브라케팅1단계_A" 3-2 File_Extension string Y Json "JSON" 3-3 Json_Data_ID string Y Json 파일명 "D3_221111_O03_L06A_L0048" 3-4 Annotations array Y - [ ] 3-5 Class_ID string Y 객체 ID "Car" 3-6 Object_num string Y Object 번호 "0" ~ "99" 3-7 Type string Y 어노테이션 종류 “Segmentation”, “Bounding_box” 3-8 Type_value array Y [x,y, x,y ...] [471, 73, 1699, 745] 6. 실제 예시
{
"Raw_Data_Info.": {
"Raw_Data_ID": "D3_220531_O03_L06A_E0015",
"Copyrighter": "㈜미디어그룹사람과숲",
"Location": "O",
"Place": "도로",
"Date": "2022-05-31",
"Resolution": "1920, 1080",
"F-stop": "F1.8",
"Exposure_Time": "1/10",
"Low_environment": "낮음",
"Exposure_bracketing": "0",
"Angle": "Eye",
"File_Extension": "jpg"
},
"Source_Data_Info.": {
"Source_Data_ID": "D3_220531_O03_L06A_E0015",
"File_Extension": "jpg"
},
"Learning_Data_Info.": {
"Path": "L06_낮음/브라케팅1단계_A",
"File_Extension": "JSON",
"Json_Data_ID": "D3_220531_O03_L06A_E0015",
"Annotations": [
{
"Class_ID": "Truck",
"Object_num": "0",
"Type": "Segmentation",
"Type_value": [1090,188,1044,173,973,164,904,161,857,172,809,187, 733,216,686,236, ...중략... 172,1119,228,1111,211]
}
]
}
}
]
}
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박종범(사업총괄책임자-PM) 02-830-8583 [email protected] 사업총괄, AI 학습용 데이터 설계/구축 데이터 품질관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜지케스 AI 학습용 데이터 가공 고려대학교 산학협력단 AI 학습용 데이터 설계 / AI 학습 모델 개발 지티원(주) AI 학습용 데이터 품질관리 주식회사 써로마인드 AI 학습용 데이터 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박종범(사업총괄책임자-PM) 02-830-8583 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.