-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-06-07 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-31 산출물 전체 공개 소개
지자체의 도로정비 대상이 되는 도로부속시설물 파손데이터 8종 (정상/파손 16개 클래스)를 탐지하여 도로부속시설물 보수지역 판단 및 예측이 가능한 인공지능 학습용 데이터 구축
구축목적
도로부속시설물 정비와 관련된 지역사회 현안 해결을 위한 도로부속시설물 파손 유형 AI 학습용 데이터 구축이 필요하며, 기초지자체 도로부속시설물 정비 AI 모델 개발을 위한 기반 마련
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체 구축 라벨링 유형 세그멘테이션(Polygon) 라벨링 형식 JSON 데이터 활용 서비스 인공지능(AI) 기반 도로 안전 통합관리 시스템 데이터 구축년도/
데이터 구축량2022년/422,610장 -
■ 데이터 구축 규모
데이터 구축 규모 데이터 종류 형식 내용 수량 원천
+
라벨링
데이터MP4 부산시 및 경남권 도로 주행 영상
(개인정보 비식별화 처리)영상 33시간 JSON,
JPG도로부속시설물 객체 8종
(정상/파손 16개 클래스)이미지 데이터(JPG) : 422,610장
라벨링 데이터(JSON) : 422,610개■ 데이터 분포
데이터 분포 항목 수랑(건) 비율(%) 클래스 수랑(건) 비율(%) PE 드럼 정상 30,511 4.36 PE 드럼 파손 40,946 5.84 PE 방호벽 정상 55,577 7.93 PE 방호벽 파손 31,918 4.57 PE 안내봉 정상 48,027 6.86 PE 안내봉 파손 31,970 4.56 라바콘 정상 60,276 8.6 라바콘 파손 58,462 8.34 시선유도봉 정상 72,370 10.33 시선유도봉 파손 39,561 5.65 제설함 정상 30,299 4.32 제설함 파손 50,643 7.23 PE 입간판 정상 41,572 5.93 PE 입간판 파손 55,655 7.94 PE 휀스 정상 26,426 3.77 PE 휀스 파손 26,430 3.77 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드■ 활용 AI 모델
활용 AI 모델 적용모델 알고리즘 Detectron2 Instance Segmentation - 지자체 도로부속시설물 16개의 카테고리(클래스)에 따라 Object Detection이 가능한 Detectron2 모델
- COCO dataset 포맷을 사용하여 8(Train):1(Valdation):1(Test) 비율로 데이터를 전처리하여 학습 수행[그림] 데이터 전처리 예시
- 학습모델 환경정보
학습모델 환경정보 항목 내용 CPU Intel(R) Xeon(R) Gold 5120 CPU @ 2.20GHz Memory 176GB GPU GPU 0: Tesla V100-SXM2-32GB
GPU 1: Tesla V100-SXM2-32GBStorage 2TB OS CentOS Linux release 7.9.2009 (Core) 개발 언어 Python 3.6.10 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 도로부속시설물 탐지 성능 Object Detection Mask R-CNN mAP@IoU 0.5 75 % 79.51 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드■ 데이터 소개
- 지자체의 도로정비 대상이 되는 도로부속시설물 파손데이터 8종(정상/파손 16개 클래스)를 탐지하여 도로부속시설물 보수지역 판단 및 예측이 가능한 인공지능 학습용 데이터 구축
∙ 수집 : 지자체 보유 차종과 유사한 종류의 트럭, 승용차 등을 활용하여 부산시 전역 및 경남권에서 원시데이터 주행 영상 획득
∙ 정제 : 품질높은 영상&이미지 데이터를 선별하여 원천데이터를 분류하고 개인정보 비식별화 작업 진행
∙ 가공 : 라벨링 저작 도구를 사용하여 Polygon 방식으로 라벨링 데이터 생성
∙ 검수 : 전문 검수 조직에 의하여 각 단계별 데이터 검수 및 예외 사항 집중관리
∙ AI모델 : 이미지 기반의 학습모델을 선정하여 데이터 품질검증 및 객체탐지 성능확인■ 대표 이미지
∙ 라벨링 이미지(Ground Truth)와 AI모델 예측결과(Prediction) 비교이미지■ 라벨링 데이터 포맷
라벨링 데이터 포맷 구분 항목명 타입 필수 설명 범위 상세 비고 여부 1 licenses array - 라이선스 - coco포맷준수 1-1 licenses[]name String - 라이선스명 최대 10글자 null 이미지 정보 1-2 licenses[].id Number - 라이선스ID [0,1,2,...] 0 이미지 정보 1-3 licenses[].url String - 라이선스URL - null 이미지 정보 2 info Object - 데이터셋정보 - coco포맷준수 2-1 info.contributor String - 데이터셋생성자 최대 5글자 null 이미지 정보 2-2 info.date_created String - 데이터셋 yyyy-MM-dd hh:mm:ss 메타데이터 *일+시 이미지 정보 생성일자 2-3 info.description String - 데이터셋 최대 10글자 null 이미지 정보 상세설명 2-4 info.url String - 데이터셋URL - null 이미지 정보 2-5 info.version String - 데이터셋버젼 V 1.0 - 이미지 정보 2-6 info.year Number - 데이터셋 2022 - 이미지 정보 생성년도 3 categories Array - 클래스 - 3-1 categories[].id Number Y 클래스ID [1,2,...] - 이미지 정보 3-2 categories[].name String Y 클래스명 [PE드럼 정상,
PE드럼 파손,
PE방호벽 정상,
PE방호벽 파손,
PE안내봉 정상,
PE안내봉 파손,
라바콘 정상,
라바콘 파손,
시선유도봉 정상,
시선유도봉 파손,
제설함 정상,
제설함 파손,
PE입간판 정상,
PE입간판 파손,
PE휀스 정상,
PE휀스 파손]메타데이터
객체 종류
(ALL)이미지 정보 4 images Array - 이미지정보 - - 4-1 images[].id Number Y 이미지ID [1,2,...] - 이미지 정보 4-2 images[].width Number Y 이미지너비 [0~1920] - 이미지 정보 4-3 images[].height Number Y 이미지높이 [0~1080] - 이미지 정보 4-4 images[].file_name String Y 이미지파일명 - - 이미지 정보 4-5 images[].license String - 이미지라이선스 - null 이미지 정보 4-6 images[].url String - 이미지URL - null 이미지 정보 4-7 images[].date_captured String Y 이미지 촬영시간 오전 AM
오후 PM메타데이터 *시간대 이미지 정보 4-8 images[].date_weather String Y 이미지 촬영 날씨 맑음 sunny
우천 wet메타데이터 *날씨 이미지 정보 4-9 images[].region String Y 이미지 촬영 지역 부산시 16개구,
경남지역메타데이터 *지역 이미지 정보 4-10 images[].car_type String Y 이미지 촬영 차종 트럭 truck
승용차 sedan메타데이터 *차량종류 이미지 정보 4-11 images[].
shoot_typeString Y 이미지
수집환경
구분실제환경 real
재현환경
reproduce메타데이터 *수집환경구분 이미지 정보 5 annotations Array 라벨링정보 - 배열형태로, 이미지 내 관찰되는 모든 객체의 정보 N개 5-1 annotations[].id Number Y 라벨링ID [1,2,...] - 객체 정보 5-2 annotations[].image_id Number Y 연관이미지ID [1,2,...] - 객체 정보 5-3 annotations[].category_id Number Y 클래스정보 [1,2,...] - 객체 정보 5-4 annotations[].segmentation Array Y 라벨링좌표 - - 객체 정보 5-5 annotations[].area Number - 라벨링크기 - - 객체 정보 5-6 annotations[].bbox Array - 라벨링 bbox 좌표 - - 객체 정보 5-7 annotations[].iscrowd Number - segmentation 라벨링 종류 [0,1,2,...] - 객체 정보 5-8 annotations[].attributes Object Y 객체종류 - - 객체 정보 5-8.1 annotations[].attributes. String Y 도로환경 차도/인도/기타 도로부속물이 위치한 공간 객체 정보 environment 5-8.2 annotations[].attributes.state1 String Y 객체상태1 일반/부분파손/넘어짐/분리/기타 도로부속물의 파손상태1 객체 정보 5-8.3 annotations[].attributes.state2 String Y 객체상태2 넘어짐/분리/기타/해당없음 도로부속물의 파손상태2 객체 정보 5-8.4 annotations[].attributes.crowd String Y 군집여부 단일/군집 도로부속물이 관찰되는모습 객체 정보 ■ 라벨링 데이터 예시
{
"license": [
{
"name": "",
"id": 0,
"url": ""
}
],
"info": {
"contributor": null,
"date_created": "2022-07-28 16:35:05",
"description": null,
"url": null,
"version": "V 1.0",
"year": 2022
},
"categories": [
{
"id": 1,
"name": "PE드럼 정상"
},
{
"id": 2,
"name": "PE드럼 파손"
},
{
"id": 3,
"name": "PE방호벽 정상"
},
{
"id": 4,
"name": "PE방호벽 파손"
},
{
"id": 5,
"name": "PE안내봉 정상"
},
{
"id": 6,
"name": "PE안내봉 파손"
},
{
"id": 7,
"name": "라바콘 정상"
},
{
"id": 8,
"name": "라바콘 파손"
},
{
"id": 9,
"name": "시선유도봉 정상"
},
{
"id": 10,
"name": "시선유도봉 파손"
},
{
"id": 11,
"name": "제설함 정상"
},
{
"id": 12,
"name": "제설함 파손"
},
{
"id": 13,
"name": "PE입간판 정상"
},
{
"id": 14,
"name": "PE입간판 파손"
},
{
"id": 15,
"name": "PE휀스 정상"
},
{
"id": 16,
"name": "PE휀스 파손"
}
],
"images": [
{
"id": 1,
"width": 1920,
"height": 1080,
"file_name": "real_sunny_AM_20220613_115325_truck_Haeundae-gu_00111.jpg",
"licence": null,
"url": null,
"date_captured": "AM",
"date_weather": "sunny",
"region": "Haeundae-gu",
"car_type": "truck",
"shoot_type": "real"
}
],
"annotations": [
{
"id": 1,
"image_id": 1,
"category_id": 7,
"segmentation": [
[
1330.65,
147.13,
1321.21,
148.08,
1322.39,
151.86,
1327.82,
153.51,
1361.57,
152.09,
1362.04,
147.37,
1354.49,
145.96,
1352.36,
89.32,
]
],
"area": 1314.0,
"bbox": [
1321.21,
82.9,
40.83,
70.61
],
"iscrowd": 0,
"attributes": {
"environment": "차도",
"state1": "일반",
"state2": "해당없음",
"crowd": "단일"
}
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜경성테크놀러지
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 홍순기 051)783-3732 [email protected] 사업 총괄, 데이터 전 공정참여, 개인정보 비식별화, 데이터 학습, 데이터 품질검증 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜넥스트솔루션 데이터 가공, 데이터 검사, 각종 디자인 엠엔에스컴퍼니(주) 데이터 가공, 데이터 검사, 각종 교육 코드브로스 데이터 획득(수집) 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 홍순기 051)783-3732 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.