-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-14 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-14 콘텐츠 최초 등록 소개
• 고양시 전역에 설치된 8천여 대의 CCTV로부터 이미지를 추출하고, 이미지 속 민원 객체를 라벨링한 종합 민원 AI 데이터셋 • 실제 CCTV 데이터를 활용하여 기존 데이터셋과는 다른 다양한 환경에서 촬영된 객체 이미지를 수집하였으며, 사람, 자동차 번호판을 비식별화하여 법적 문제가 없는 데이터를 확보
구축목적
빈번하게 발생하는 민원 요소를 자동으로 탐지하는 AI 모델을 훈련하기 위한 CCTV 이미지 데이터셋
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체수집 라벨링 유형 바운딩박스(이미지) 라벨링 형식 json 데이터 활용 서비스 민원 발생 전 CCTV를 기반으로 자동으로 민원 요소를 검출하여 알려주는 민원 종합 알림 서비스 데이터 구축년도/
데이터 구축량2021년/이미지, 라벨 데이터 각 100만 건 -
데이터셋 통계 (구축 규모 및 분포)
- 데이터 구축 규모
– 이미지 총 100만 건, 라벨 총 100만 건 - 데이터 분포
– 라벨별 분포데이터 분포 라벨별 분포 분류 라벨 수량 라벨별 비율 분류별 비율 쓰레기 도로변쓰레기봉투더미(낮) 40,000 4.00% 26.50% 도로변쓰레기봉투더미(밤) 40,000 4.00% 도로변비포장쓰레기(낮) 20,000 2.00% 도로변비포장쓰레기(밤) 20,000 2.00% 골목포장쓰레기봉투더미(낮) 40,000 4.00% 골목포장쓰레기봉투더미(밤) 40,000 4.00% 골목비포장쓰레기(낮) 35,000 3.50% 골목비포장쓰레기(밤) 30,000 3.00% 현수막 가로현수막(낮) 50,000 5.00% 20.00% 가로현수막(밤) 50,000 5.00% 세로현수막(낮) 50,000 5.00% 세로현수막(밤) 50,000 5.00% 공사현장 안전간판(낮) 1,000 0.10% 8.00% 안전간판(밤) 1,000 0.10% PE펜스(낮) 2,000 0.20% PE펜스(밤) 1,000 0.10% 중장비(낮) 20,000 2.00% 중장비(밤) 15,000 1.50% 고깔(낮) 20,000 2.00% 고깔(밤) 20,000 2.00% 보행방해물 엑스배너(낮) 30,000 3.00% 25.50% 엑스배너(밤) 30,000 3.00% 비활성에어간판(낮) 25,000 2.50% 비활성에어간판(밤) 12,500 1.30% 활성에어간판(낮) 12,500 1.30% 활성에어간판(밤) 15,000 1.50% 간이테이블(낮) 15,000 1.50% 간이테이블(밤) 15,000 1.50% 간이의자(낮) 25,000 2.50% 간이의자(밤) 15,000 1.50% 간이표지판(낮) 30,000 3.00% 간이표지판(밤) 30,000 3.00% 불법주정차 불법주정차SUV(낮) 50,000 5.00% 20.00% 불법주정차SUV(밤) 50,000 5.00% 불법주정차승용차(낮) 50,000 5.00% 불법주정차승용차(밤) 50,000 5.00%
기타 정보
- 실재성
– 고양시 전역에 설치되어 실제 운용되는 8,000여 대의 CCTV를 통해 데이터를 수집 - 다양성
– 다양한 시간대와 밝기, 각도, 대상에 대한 데이터를 확보 - 범용성
– 범용성 높은 파일 포맷인 JPG, JSON으로 데이터를 구축
- 데이터 구축 규모
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드활용 모델
- 개발 모델 개요
– 구축 데이터를 활용하여 CCTV 이미지 내 민원 객체를 탐지하는 객체 인식 AI 모델을 개발
– YOLOv5 알고리즘을 활용하여, pre-trained 모델에 대한 전이학습을 수행 - AI모델 사용 데이터 비율(수량)
– 36개 라벨들 간의 유사성을 고려하여 아래와 같이 라벨을 선정하였으며, 라벨별로 각 10,000건을 적용함활용 모델 모형번호 라벨 구축 수량 적용 수량 비율 → 라벨 적용 수량 비율 1 도로변 쓰레기 봉투 더미(낮) 40,000 10,000 25% 도로변 쓰레기 봉투 더미(낮) 10,000 25% 2 도로변 쓰레기 봉투 더미(밤) 40,000 3 도로변 비포장 쓰레기(낮) 20,000 10,000 50% 도로변 비포장 쓰레기(낮) 10,000 50% 4 도로변 비포장 쓰레기(밤) 20,000 5 골목 포장 쓰레기 봉투 더미(낮) 40,000 6 골목 포장 쓰레기 봉투 더미(밤) 40,000 7 골목 비포장 쓰레기(낮) 35,000 8 골목 비포장 쓰레기(밤) 30,000 9 가로현수막(낮) 50,000 10,000 20% 가로현수막(낮) 10,000 20% 10 가로현수막(밤) 50,000 11 세로현수막(낮) 50,000 10,000 20% 세로현수막(낮) 10,000 20% 12 세로현수막(밤) 50,000 13 안전간판(낮) 1,000 14 안전간판(밤) 1,000 15 PE 펜스(낮) 2,000 16 PE 펜스(밤) 1,000 17 중장비(낮) 20,000 10,000 50% 중장비(낮) 10,000 50% 18 중장비(밤) 15,000 19 고깔(낮) 20,000 10,000 50% 고깔(낮) 10,000 50% 20 고깔(밤) 20,000 21 엑스배너(낮) 30,000 10,000 33.30% 엑스배너(낮) 10,000 33.30% 22 엑스배너(밤) 30,000 23 비활성에어간판(낮) 25,000 10,000 40% 비활성에어간판(낮) 10,000 40% 24 비활성에어간판(밤) 12,500 25 활성에어간판(낮) 12,500 10,000 80% 활성에어간판(낮) 10,000 80% 26 활성에어간판(밤) 15,000 27 간이테이블(낮) 15,000 10,000 66.70% 간이테이블(낮) 10,000 66.70% 28 간이테이블(밤) 15,000 29 간이의자(낮) 25,000 10,000 40% 간이의자(낮) 10,000 40% 30 간이의자(밤) 15,000 31 간이표지판(낮) 30,000 10,000 33.30% 간이표지판(낮) 10,000 33.30% 32 간이표지판(밤) 30,000 33 불법주정차SUV(낮) 50,000 10,000 20% 불법주정차SUV(낮) 10,000 20% 34 불법주정차SUV(밤) 50,000 35 불법주정차승용차(낮) 50,000 10,000 20% 불법주정차승용차(낮) 10,000 20% 36 불법주정차승용차(밤) 50,000 합계 140,000 14% 합계 140,000 14%
서비스 활용 시나리오
- 사업을 통해 구축한 학습용 데이터를 활용하여, 지역별 민원 요소를 검출하고 관리하는 민원 종합 알림 솔루션 등을 개발 가능함
- CCTV가 설치된 곳에서 불법주정차, 쓰레기 더미, 불법 현수막, 인도 방해물, 공사 등을 검출하고, 해당 지표를 위와 같이 시각적으로 표현하여, 예상 민원 검출 현황을 지도로 시각화해서 제공
- 이를 통해서, 민원에 대한 선제적 대응을 진행할 수 있고, 민원 발생 현황을 체계적으로 관리할 수 있음
- 개발 모델 개요
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 객체인식 속도 Object Detection YOLO v5 FPS 10 단위없음 20.93 단위없음 2 객체인식 정확도 Object Detection YOLO v5 mAP 60 % 67.07 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터셋 구성
- 원천데이터
– FHD급의 원시데이터를 416X416으로 리사이징한 이미지 데이터
- 라벨링데이터 구성- 메타데이터 구성
– 메타데이터 구성라벨링데이터 구성 메타데이터 구성 구분 항목명 타입 필수여부 설명 범위 1-1 job_Id String Y 영상 관리 ID 1-2 resource_Id String Y resource 영상 ID 1-3 resource_Path String Y 원천데이터 영상파일 경로 1-4 resource String Y 원천데이터 영상파일 이름 1-5 resource_Size Number Y 영상 크기 1-6 total_Frame Number Y 영상 총 프레임 수 1-7 sampling_Count Number Y 이미지 샘플링 수 1-8 duration Number Y 영상 총 길이 1-9 fps Number Y 영상 초당 이미지 장수 1-10 Resolution String Y CCTV 해상도 1-11 film_Time String Y 촬영 시각 1-12 lat Number Y CCTV 위치(위도) 1-13 lon Number Y CCTV 위치(경도) 1-14 place String Y 영상 장소 분류 1-15 precipitation String Y 강수 유무 [“0”, “1”] 라벨링데이터 구성 가공데이터 구성 구분 항목명 타입 필수여부 설명 범위 1 Bbox Annotation Object Y 1 1-1 contextId String Y 작업 결과물 ID 1-2 frame Number Y 영상 이미지 프레임 넘버 1-3 boxCount Number Y 이미지 속 Bounding Box 개수 1-4 atchFilePath String Y 이미지 파일이 있는 경로 1-5 atchFileName String Y 영상 속 추출한 이미지 파일 이름 1-6 atchOrgFileName String Y 영상 속 추출한 이미지 파일 식별 이름 1-7 atchFileSize Number Y 이미지 파일 크기 1-8 Box Array Y 이미지 속 Bounding Box 1 1-8-1 category_id Number Y 객체 유형 코드값 [1~36] 1-8-2 category_name String Y 객체 유형 이름 1-8-3 x Number Y Bounding Box 좌상단 x축 좌표 1-8-4 y Number Y Bounding Box 좌상단 y축 좌표 1-8-5 w Number Y Bounding Box 가로 길이 1-8-6 h Number Y Bounding Box 세로 길이 - 라벨링데이터 실제예시
- 라벨 데이터 시각화 예시
- 원천데이터
-
데이터셋 구축 담당자
수행기관(주관) : 고양시
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 안동수 031-8075-2570 [email protected] · 총괄 책임 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜인사이터 · 데이터 가공 및 검수 광운대학교 산학협력단 · AI모델 개발 ㈜아와소프트 · 데이터 수집 및 정제 ㈜아이웹 · 데이터 가공 맞손스스로마을관리사회적협동조합 · 데이터 검수
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.