신호등/도로표지판 인지 영상(수도권)
- 분야교통물류
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3 2021-11-01 데이터 품질 보완 1.2 2021-09-23 데이터 품질 보완 1.1 2021-08-17 데이터 품질 보완 1.0 2021-06-18 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-11-23 데이터 설명서 수정 2022-10-13 신규 샘플데이터 개방 소개
신호등, 도로 표지판 등 객체 인지를 위한 수도권 지역 도로 주행 영상 및 이미지 데이터
구축목적
주행 영상에서 신호등, 교통 표지판의 위치를 파악하고, 신호등의 신호상태나 표지판의 지시/규제/주의 등의 속성을 파악하는 모델 학습을 위한 데이터셋
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/95만 -
구축 내용 및 제공 데이터량
- 300시간 이상의 원시데이터 (주행 영상)에서 이미지를 추출하고 객체 라벨링 및 비식별화 작업 수행
- 하단 구축 내용은 53/54 데이터를 통합한 구축량임
- 가공 이미지 수량: 1,915,672장 (목표량: 190만장)
수도권 803,060장 광역시, 고속도로, 국도 등 808,994장 동적객체 과제 영상 공유 303,618장 신호등 객체 수량 3,029,801 표지판 객체 수량 2,946,632
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 신호등 인식 (classification) 모델 Image Classification MobileNetV2 Accuracy 80 % 96.7 % 2 표지판 탐지 (detection) 모델 Object Detection YOLO v4 scaled 1536 mAP 50 % 65 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
신호등/도로표지판 인지 영상(수도권)-데이터변경이력 버전 일자 변경내용 비고 1.3 2021.11.01 데이터 품질 보완 1.2 2021.09.23 데이터 품질 보완 1.1 2021.08.17 데이터 품질 보완 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 주행 영상에서 신호등, 교통 표지판의 위치를 파악하고, 신호등의 신호상태나 표지판의 지시/규제/주의 등의 속성을 파악하는 모델 학습을 위한 데이터셋
활용 분야
- 자율주행 실시간 영상 인식 기술 개발, 자율주행을 위한 정밀 지도 제작 자동화 기술 개발 등
소개
- 다양한 주행 환경에서 차량에 설치된 카메라를 통해 취득한 영상 데이터에서 신호등과 도로교통표지판의 위치를 bounding box 형태로 가공한 데이터를 제공하며, 각 객체의 상태 (신호등 불빛, 표지판 종류 등)의 2차 속성 정보를 제공하는 데이터
구축 내용 및 제공 데이터량
- 300시간 이상의 원시데이터 (주행 영상)에서 이미지를 추출하고 객체 라벨링 및 비식별화 작업 수행
- 하단 구축 내용은 53/54 데이터를 통합한 구축량임
- 가공 이미지 수량: 1,915,672장 (목표량: 190만장)
수도권 803,060장 광역시, 고속도로, 국도 등 808,994장 동적객체 과제 영상 공유 303,618장 신호등 객체 수량 3,029,801 표지판 객체 수량 2,946,632
대표도면
필요성
- 인공지능의 폭발적인 발전은 이미지넷과 같은 거대한 데이터셋의 구축에서부터 비롯되는 것으로부터 비추어 볼 때, 한국의 자율주행 연구와 AI 기업의 발전을 위해 한국형 자율주행 데이터 구축 필요
- 해외 주요 자율주행 데이터셋 대부분이 차량 운행 중 동적 객체(차량 및 보행자)데이터 중심으로 정적 객체(차선, 횡단보도, 신호등, 표지판 등)에 대한 데이터 기반은 상대적으로 부족
- 정적 객체 정보의 경우 국가별 도로교통 법규와 도로 시설물 표준이 상이하기 때문에 한국 자율주행 환경에서의 정적 객체 데이터 기반 마련 필요성 존재 (예를 들어, 신호등의 경우 국내는 가로방향이 많고, 해외는 세로방향이 많음)
데이터 구조
데이터 구조 표 대상 분류 항목 타입 값 표지판 어노테이션 정보
(annotation)모양
(shape)string 세모 (triangle)
네모 (rectangle)
동그라미 (circle)색상
(color)string 노랑 (yellow)
빨강 (red)
파랑 (blue)종류
(kind)string 일반 (normal)
LED (led)bbox 정보
(box)array 좌표값 기타 숫자
(text)integer 표지판 내 기타 숫자 종류
(type)string 주의 (warning)
규제 (restriction)
지시 (instruction)클래스 정보
(class)string 도로 표지판 (traffic_sign) 신호등 어노테이션 정보
(annotation)구(등)수
(light_count)integer 신호등 구(등)수 bbox 정보
(box)array 좌표값 상태 세부 속성
(attribute)string 차 (car)
보행자 (pedestrian)
버스 (bus)
자전거 (bicycle)
알 수 없음 (unknown)종류
(type)array 좌표값 클래스 정보
(class)string 신호등 (traffic_light) 유고정보 (traffic_information) 어노테이션 정보
(annotation)클래스 정보
(class)string traffic information bbox 정보
(box)array 좌표값 세부 속성 string cone
pot_hole
construction
unknown이미지 이미지 정보
(image)파일명
(filename)string 작업대상 파일명 이미지 크기
(imsize)integer 작업대상 이미지 크기 -
데이터셋 구축 담당자
수행기관(주관) : 라이드플럭스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 정하욱 (박중희) 064-748-8039 [email protected] · 비수도권 주행 데이터 수집 · AI 시범 모델 개발 (차선영역인식, 신호등 분류) · 얼굴/차량번호판 비식별화 · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 쏘카 · 전국 주행 데이터 수집 모빌테크 · 수도권 주행 데이터 수집 데이터메이커 · 차선/횡단보도 데이터 라벨링 한국창직협회 · 차선/횡단보도 데이터 라벨링 인피닉 · 신호등/표지판 데이터 라벨링
· 얼굴/차량번호판 비식별화중앙대학교 · 표지판 분류 압축 모델 개발
· 신호등 데이터 증강 모델 개발울산과학기술원 · 주행경로 생성/예측 모델 개발
· 보행자 탐지 모델 개발데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 정하욱 (박중희)(라이드플럭스) 064-748-8039 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.