-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-05-23 최종데이터 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-05 산출물 전체 공개 소개
ㅇ CCTV 기반 차량정보 및 교통정보 계측 데이터 - 치안활동 지원 및 미관측구간 교통흐름 예측을 위한 CCTV 영상 내 차량 정보 식별 및 교통정보 계측 영상 데이터 구축 - 여러 유형의 교차로, 접근로, 이면도로에 설치된 CCTV 영상을 수집하여 CCTV관점에서의 차종 및 세부모델명과 차량번호판 내 문자 인식을 위한 데이터 구축
구축목적
치안 활동 지원 및 미관측구간 교통흐름 예측을 위한 CCTV 영상 내 차량 정보 식별 및 교통정보 계측 영상 데이터 구축
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 CCTV 녹화 영상 라벨링 유형 바운딩 박스 라벨링 형식 JSON 데이터 활용 서비스 ㅇ 딥러닝 분석을 통한 최적의 신호주기(TOD) 생성 ㅇ 구축된 데이터 공유를 통한 공공/산학연 연구 지원 데이터 구축년도/
데이터 구축량2022년/ㅇ 차량번호판 인식 1,001,657장 ㅇ 차종외관 인식 1,007,219장 -
ㅇ 데이터 구축 규모
데이터 구축 규모 CCTV 화질 수집지역 수집유형 수집장소개수 CCTV 개수 구축량 UHD 경기도 안양시 교차로 5개소 20개 지점 796,517장 접근로 2개소 8개 지점 198,294장 FHD 경기도 안양시 이면도로 15개소 15개 지점 372,762장 경기도 판교지역 교차로 6개소 14개 지점 350,980장 접근로 1개소 1개 지점 39,632장 대구광역시 교차로 2개소 10개 지점 250,691장 총계 31개소 68개 지점 2,008,876장 ㅇ 데이터 분포
- 차종외관 인식
1. 클래스 분포클래스 분포 구분 승용/승합 버스 소형화물차 중형화물차 대형화물차 이륜차 기타 합계 구축 비율 84.90% 3.30% 7.50% 1.40% 0.10% 2.30% 0.60% 100% 구축량 1,816,945개 70,167개 160,173개 29,009개 1,363개 48,308개 13,803개 2,139,773개 2. 환경적 분포
환경적 분포 구분 맑음(S) 강우(R) 안개(F) 합계 구축 비율 84.90% 14.10% 0.90% 100% 구축량 855,602장 142,495장 9,122장 1,007,219장 3. 첨두/비첨두 분포
첨두/비첨두 분포 구분 첨두 비첨두 합계 구축 비율 38.40% 61.60% 100% 구축량 386,620장 620,599장 1,007,219장 4. 계절별 분포
계절별 분포 구분 여름(SU) 가을(FA) 합계 구축 비율 49.40% 50.60% 100% 구축량 497,078장 510,141장 1,007,219장 5. CCTV 화질별 분포
CCTV 화질별 분포 구분 UHD FHD 합계 구축 비율 49.30% 50.70% 100% 구축량 497,035장 510,184장 1,007,219장 6. 도로유형별 분포
도로유형별 분포 구분 교차로 이면도로 접근로 합계 구축 비율 69.70% 18.50% 11.90% 100% 구축량 701,562장 185,987장 119,670장 1,007,219장 7. 시간대별 분포
시간대별 분포 구분 심야 오전 오후 저녁 합계 구축 비율 3.60% 39.90% 40.10% 16.40% 100% 구축량 36,144장 401,501장 404,044장 165,530장 1,007,219장 8. 수집 장소별 분포
수집 장소별 분포 구분 경기도 안양시 경기도 판교 대구광역시 합계 구축 비율 67.80% 19.80% 12.30% 100% 구축량 683,022장 199,845장 124,352장 1,007,219장 차량번호판 인식
1. 클래스 분포클래스 분포 구분 비사업용 사업용 건설기계용 친환경용 이륜차 기타 합계 구축 비율 44.50% 3.30% 0.50% 0.40% 0.50% 50.70% 100% 구축량 1,350,484개 101,507개 16,603개 13,507개 16,071개 1,539,134개 3,037,306개 2. 환경적 분포
환경적 분포 구분 맑음(S) 강우(R) 안개(F) 합계 구축 비율 83.80% 15.30% 0.90% 100% 구축량 839,597장 152,988장 9,072장 1,001,657장 3. 첨두/비첨두 분포
첨두/비첨두 분포 구분 첨두 비첨두 합계 구축 비율 39.30% 60.70% 100% 구축량 393,378장 608,279장 1,001,657장 4. 계절별 분포
계절별 분포 구분 여름(SU) 가을(FA) 합계 구축 비율 50.80% 49.20% 100% 구축량 508,616장 493,041장 1,001,657장 5. CCTV 화질별 분포
CCTV 화질별 분포 구분 UHD FHD 합계 구축 비율 49.70% 50.30% 100% 구축량 497,776장 503,881장 1,001,657장 6. 도로유형별 분포
도로유형별 분포 구분 교차로 이면도로 접근로 합계 구축 비율 69.50% 18.60% 11.80% 100% 구축량 696,626장 186,775장 118,256장 1,001,657장 7. 시간대별 분포
시간대별 분포 구분 심야 오전 오후 저녁 합계 구축 비율 3.30% 40.60% 40.80% 15.30% 100% 구축량 32,713장 406,966장 408,439장 153,539장 1,001,657장 8. 수집 장소별 분포
수집 장소별 분포 구분 경기도 안양시 경기도 판교 대구광역시 합계 구축 비율 68.30% 19.00% 12.60% 100% 구축량 684,551장 190,767장 126,339장 1,001,657장 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드ㅇ 딥러닝 분석을 통한 최적의 신호주기(TOD) 생성
- 본 사업에 구축되는 교차로 영상정보, 차량번호판, 교차로 와 교차로 사이의 미관측 데이터 등을 활용하여 메타 데이터를 생성, 생성된 메타 데이터는 빅데이터로 수집하여 딥러닝 분석을 통한 최적의 소통정보를 생성하기 위한 기반 마련 및 생성된 소통정보 분석 데이터를 활용하여 최적의 신호주기(Time Of Day) 데이터를 생성함< 그림 > 스마트교차로 운영예시
< 그림 > 최적의 신호주기 데이터 생성 절차
< 그림 > GIS기반 신호현시 및 차량 객체 시각화 <그림> 차로 혼잡도 분석 시각화
< 그림 > 공유 플랫폼 개념도
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 차량 번호판 (OCR 문자인식) Optical Character Recognition YOLO v4 Accuracy 90 % 91.44 % 2 차량 외관 (차종/모델명/년식) Image Classification TransFG F1-Score 0.9 점 0.901 점 3 차량 번호판 (객체 탐지) Object Detection YOLO v4 mAP 85 % 85.2 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드ㅇ 대표 도면
대표 도면 데이터명 CCTV 기반 차량 정보 및 교통정보 계측 데이터 데이터포맷 - 원시데이터 : mp4 - 원천데이터 : jpg(1920*1080, 3840*2160) - 라벨링데이터 : json 데이터 출처 - 데이터 수집 : 미디어그룹사람과숲, 라온로드, 차세대융합기술연구원 - 데이터 정제 : 맥스테드 - 데이터 가공 : 미디어그룹사람과숲, 인피닉, 이씨오 데이터 구축 규모 - 차량번호판 인식 1,001,657장 - 차종외관 인식 1,007,219장 라벨링데이터 구성
- 차량번호판 인식차량번호판 인식 분류 속성명 속성 설명 데이터 필수 예시 타입 여부 Raw_Data_Info. raw_data_id 원시 파일명 string Y "C-220701_06_CR01_01 location_id 촬영장소 id string Y "cr01" location_name 촬영장소명 string Y "비산사거리" cctv_number 카메라 촬영 방향 string Y “01” copyrighter 미디어그룹사람과숲 string Y "(주)미디어그룹사람과숲" resolution 해상도 string Y “3840, 2160” date 촬영일시 (yyyy-mm-dd) string Y "2022-07-01" start_Time 촬영 시작 시각 string Y "06:00:00" end_Time 촬영 종료시간 string Y "07:00:00" length 영상길이 초(sec) integer Y 3600 fps fps integer Y 30 season 계절 string Y "su" weather 날씨 string Y "s" day_type 평일/주말/휴일 string Y "w" road_type 도로 유형 string Y "cr" cross_type 교차로 유형 string N "f3" cctv_type cctv 카메라 유형 integer Y 0 lens_type cctv 카메라 렌즈 유형 string Y "wa" cctv_height cctv 설치 높이(cm) integer Y 700 cctv_angle cctv 각도 integer Y 22 cctv_gps cctv 설치지점 gps(위도,경도) array Y [37.8469, 126.9555] file_extension 원시 파일 확장자 string Y "mp4" Source_Data_Info. source_data_id 이미지 파일명 string Y "C-220701_06_CR01_01_N0940" classification_id 분류id string Y "n" extract_time 추출시간(hh:mm:ss) string Y "06:35:12" file_extension 원천 파일 확장자 string Y "jpg" Learning_Data_Info. path json 폴더 경로 string Y "/차량번호판인식/교차로/[cr01]비산사거리/01번” json_data_id json 파일명 string Y "C-220701_06_CR01_01_N0940" file_extension 학습데이터 확장자 string Y "json" annotations license_plate 차량번호판 annotation class_id 차량번호판 클래스명 string Y "no_01" text 차량번호판_text string N "32수" bbox boundbox 좌표값 [x, y, w, h] array Y [1325, 872, 1398, 893] index 차량번호판 식별 번호 integer N 1 license_plate_number 차량번호판 숫자 및 글자 annotation text 차량번호판 문자명 string N "3" bbox boundbox 좌표값 [x, y, w, h] array N [845, 937, 855, 949] index 차량번호판 숫자 및 글자 식별 번호 string N "1" - 차종외관 인식
차종외관 인식 분류 속성명 속성 설명 데이터 필수 예시 타입 여부 Raw_Data_Info. raw_data_id 원시 파일명 string Y "C-220701_06_CR01_01 location_id 촬영장소 id string Y "cr01" location_name 촬영장소명 string Y "비산사거리" cctv_number 카메라 촬영 방향 string Y “01” copyrighter 미디어그룹사람과숲 string Y "(주)미디어그룹사람과숲" resolution 해상도 string Y “3840, 2160” date 촬영일시 (yyyy-mm-dd) string Y "2022-07-01" start_Time 촬영 시작 시각 string Y "06:00:00" end_Time 촬영 종료시간 string Y "07:00:00" length 영상길이 초(sec) integer Y 3600 fps fps integer Y 30 season 계절 string Y "su" weather 날씨 string Y "s" day_type 평일/주말/휴일 string Y "w" road_type 도로 유형 string Y "cr" cross_type 교차로 유형 string N "f3" cctv_type cctv 카메라 유형 integer Y 0 lens_type cctv 카메라 렌즈 유형 string Y "wa" cctv_height cctv 설치 높이(cm) integer Y 700 cctv_angle cctv 각도 integer Y 22 cctv_gps cctv 설치지점 gps(위도,경도) array Y [37.8469, 126.9555] file_extension 원시 파일 확장자 string Y "mp4" Source_Data_Info. source_data_id 이미지 파일명 string Y "C-220701_06_CR11_01_A0036" classification_id 분류id string Y "a" extract_time 추출시간(hh:mm:ss) string Y "06:35:12" file_extension 원천 파일 확장자 string Y "jpg" Learning_Data_Info. path json 폴더 경로 string Y "차종외관인식교차로/[cr11]유가사입구사거리/01번" json_data_id json 파일명 string Y "C-220701_06_CR01_01_A0036" file_extension 학습데이터 확장자 string Y "json" annotations class_id 차량종류 클래스명 string Y "car-01" type annotation 유형 string Y bbox coord boundbox 좌표값 [x, y, w, h] array Y [845, 937, 190, 150] brand_id 제조사명 string Y “현대” model_id 세부모델명 string Y “제네시스_G80(RG3) ㅇ 라벨링데이터 실제 예시
차종외관 인식
"Raw Data Info": {
"raw_data_id": "C-220809_06_CR01_01",
"location_id": "cr01",
"location_name": "비산사거리",
"cctv_number": "01",
"copyrighter": "(주)미디어그룹사람과숲",
"resolution": "3840, 2160",
"date": "2022-08-09",
"start_time": "06:00:00",
"end_time": "07:00:00",
"length": 3600,
"fps": 30,
"season": "su",
"weather": "r",
"day_type": "w",
"road_type": "cr",
"cross_type": "f4",
"cctv_type": 0,
"lens_type": "na",
"cctv_height": 700,
"cctv_angle": 22,
"cctv_gps": [
37.3985,
126.9339
],
"file_extension": "mp4"
},
"Source Data Info": {
"source_data_id": "C-220809_06_CR01_01_A0035",
"classification_id": "a",
"extract_time": "06:01:45",
"file_extension": "jpg"
},
"Learning Data Info": {
"path": "/차종외관인식/교차로/[cr01]비산사거리/01번",
"json_data_id": "C-220809_06_CR01_01_A0035",
"file_extension": "json",
"annotations": [
{
"class_id": "car-01",
"type": "bbox",
"coord": [
2200.29,
1521.34,
408.54,
283.76
],
"brand_id": "기아",
"model_id": "K5_2세대(2015)"
},
{
"class_id": "car-01",
"type": "bbox",
"coord": [
47.11,
1162.9,
308.47,
159.9
],
"brand_id": "도요타",
"model_id": "캠리_XV70(2017)"
},
{
"class_id": "car-01",
"type": "bbox",
"coord": [
1858.63,
1125.2,
211.17,
197.22
],
"brand_id": "기아",
"model_id": "쏘렌토_R(2009)"
},
{
"class_id": "car-01",
"type": "bbox",
"coord": [
2244.68,
1241.15,
267.45,
189.28
],
"brand_id": "현대",
"model_id": "쏘나타_YF(2009)"
},{
"class_id": "car-01",
"type": "bbox",
"coord": [
1549.1,
1075.2,
167.45,
163.6
],
"brand_id": "기아",
"model_id": "스포티지_4세대(2015)"
},
{
"class_id": "car-03",
"type": "bbox",
"coord": [
1146.24,
1610.36,
665.51,
518.74
],
"brand_id": "현대",
"model_id": "메가트럭"
}
]
}
}차량번호판 인식
{
"Raw_Data_Info": {
"raw_data_ID": "C-221006_07_CR03_03",
"location_ID": "cr03",
"location_name": "범계사거리",
"cctv_number": "03",
"copyrighter": "(주)미디어그룹사람과숲",
"resolution": "3840, 2160",
"date": "2022-10-06",
"start_time": "07:00:00",
"end_time": "08:00:00",
"length": 3600,
"fps": 30,
"season": "fa",
"weather": "s",
"day_type": "w",
"road_type": "cr",
"cross_type": "f4",
"cctv_type": 0,
"lens_type": "na",
"cctv_height": 700,
"cctv_angle": 22,
"cctv_gps": [
37.3888,
126.9477
],
"file_extension": "mp4"
},
"Source_Data_Info": {
"source_data_ID": "C-221006_07_CR03_03_N1308",
"classification_ID": "n",
"extract_time": "07:54:28",
"file_extension": "jpg"
},
"Learning_Data_Info": {
"path": "/차량번호판인식/교차로/[cr03]범계사거리/03번",
"file_extension": "json",
"json_data_ID": "C-221006_07_CR03_03_N1308",
"annotations": [
{
"license_plate": [
{
"class_ID": "no_01",
"text": "90누",
"bbox": [
1864,
1638,
85,
43
],
"index": 1
}
],
"license_plate_number": [
{
"text": "9",
"bbox": [
1869,
1653,
8,
17
],
"index": 1
},
{
"text": "0","bbox": [
1880,
1653,
9,
17
],
"index": 1
},
{
"text": "누",
"bbox": [
1890,
1656,
9,
14
],
"index": 1
}
]
}
]
}
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜미디어그룹사람과숲
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 정용운 [email protected] [email protected] 사업 총괄, 데이터 설계, 데이터 수집, 데이터 가공, 데이터 검사 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜라온로드 데이터 수집 ㈜맥스테드 데이터 정제 ㈜이씨오 데이터 가공 ㈜인피닉 데이터 가공, 데이터 검사 차세대융합기술연구원 데이터 수집 펜타시스템테크놀러지㈜ 응용서비스 개발 ㈜써로마인드 인공지능 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 정용운 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.