차량 관제 서비스 고도화를 위한 모빌리티 데이터
- 분야교통물류
- 유형 텍스트
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-01-19 데이터 최종 개방 1.0 2023-07-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-02-16 산출물 전체 공개 소개
차량 대수 3,000대 수준의 하루 1시간 가량 약 3개월 이상 운행한 데이터를 다음과 같은 지역에서 수집하였음 - 서울, 6대 광역시(인천/대전/광주/대구/부산/울산)와 경기도 지역
구축목적
● 교통 수요 및 이동량 분석 ● 탑승자별 이동 및 주행 패턴 분석 ● 차량 주행 정보 기반 차량 관리 데이터 분석 ● 운행에 따른 도로 환경 분석 ● 스마트시티 운영 계획 ● 차량 최적 배치 및 분산 ● 차량 운용에 따른 차량 관리 서비스
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 텍스트 데이터 형식 Json 데이터 출처 기관 직접 수집 라벨링 유형 바운딩박스(텍스트) 라벨링 형식 Json 데이터 활용 서비스 교통 유발 시설물 기반 교통 수요 예측 서비스 데이터 구축년도/
데이터 구축량2022년/410,313건 -
- 데이터 구축 규모
* 원천 데이터 총 18,880,725건 중 라벨링 데이터 410,313건- 데이터 구축 규모 지역별 데이터 데이터 형태 원천데이터 라벨링 데이터 규모(건) 비율(%) 규모(건) 비율(%) 서울 텍스트
(Json)5,728,584 30.34 136,450 33.26 인천 2,374,269 12.58 49,108 11.97 대전 2,320,866 12.29 59,409 14.48 광주 945,145 5 21,580 5.26 대구 2,328,009 12.33 61,726 15.04 울산 503,536 2.67 5,214 1.27 부산 819,178 4.34 12,266 2.99 경기도 3,861,138 20.45 64,560 15.73 총합 18,880,725 100 410,313 100 - 데이터 분포
* 지역별 분포 : 서울, 인천, 대전, 광주, 대구, 울산, 부산, 경기도 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용모델
* TGNet을 이용한 교통 유발 시설물에 따른 교통 수요 학습 모델로 시간별 승하차가 발생한 지역에 대해 4시간 단위로 학습을 하고, 1시간 후 교통 수요를 예측함
* TGNet은 지역별 차량 수요량을 2D로 변환하고, 이를 시간에 따라 누적한 3D 데이터를 학습하여 다음 시간의 차량 수요량을 예측함
* TGNet 학습모델의 Basic Model Architecture는 다음과 같음
* TGNet의 Basic Model Architecture에서 Temporal Embedding, Supplement Embedding 과정이 필요하며 다음과 같이 진행됨
∙ Temporal Embedding
▹ 예측 성능을 높이기 위해 위의 데이터에 예측 시점의 시간적 특성(요일, 시간, 휴일유무 등), 차량 수요 목적지 정보(교통 유발 시설물 카테고리 합계)를 2D로 변환 후 Basic Model Architecture와 결합
∙ Supplement Embedding
▹ Late Fusion을 통해 초기 입력 정보인 지역별 차량 수요량 데이터 이외 정보를 결합할 수 있으며, 이를 통해 예외 상황에 대한 모델의 강인함을 향상함- 서비스 활용 시나리오
* 교통 수요 예측 활용
∙ 승하차 데이터 및 교통 유발 시설물에 대하여 위치, 시간, 날씨에 따른 교통 수요량을 예측하고 사용자가 한눈에 알아볼 수 있도록 지도에 표시한 데이터를 제공하는 서비스
∙ 다음과 같은 서비스를 제공할 수 있음
▹ 관리자 페이지를 통해 차량의 배차 상태 및 모니터링 정보 확인
▹ 스마트 배차 기능을 통해 차량의 출발 및 마감 시간, 운행 지역 정보 입력
▹ 운행 지역의 시간별 교통량 분석 차트와 추천 운행 경로 확인
* 지능형 교통 시스템 활용
∙ 교통 흐름은 날씨, 시간, 날짜 등 다양한 변수로 인해 영향을 받고 있지만, 현재 교통 체계에서는 다양한 변수들이 적용되고 있지 않음
∙ 특정 시간에 많은 운전자가 사용하는 도로이거나 추가로 신호체계를 구축할 경우, 유연한 신호체계를 바탕으루 구축해야 하나 기존 작동되고 있는 신호체계와 맞지 않는 현상이 발생
∙ 따라서 수집한 차량 관제 서비스 고도화를 위한 모빌리티 데이터를 바탕으로 날씨, 시간별 교통 수요를 예측하고, 교통 정보 센터의 신호체계와 연동되는 지능형 시뮬레이션에 활용할 수 있음 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 교통 유발 시설물에 따른 교통 수요 모델 Estimation TGNet MAPE 30 % 9 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 원천 데이터 설명
* 다양한 수집 장비를 활용하여 수집한 원시 데이터를 시간을 활용하여 병합
* 추후 라벨링 작업에 활용할 수 있도록 아래와 같은 포맷으로 원천 데이터 생성- 원천 데이터 설명 번호 항목 길이 타입 설명 한글명 영문명 1 사용자 정보 user_info 29 obejct 사용자 정보 1 차량 ID car_id 10 string Key-차량 ID 2 성별 user_sex 1 integer 사용자 성별 3 생년 age 8 long 사용자 생년 4 지역 user_location 10 string 사용자 지역 2 차량 정보 user_car_info 17 object 사용자 차량 정보 1 용도 user_car_class 1 integer 차량 용도 정보 2 브랜드 user_car_brand 1 integer 차량 브랜드 정보 3 연식 user_car_year 4 integer 차량 연식 정보 4 차종 user_car_model 1 string 1: 경형, 2: 소형, 3: 준중형 4: 중형, 5: 준대형, 6: 대형, 7: 스포츠카 5 중량 user_car_weight 6 float 차량 중량 6 배기량 user_car_displace 4 integer 차량 배기량 7 연비 user_car_efficiency float 차량 연비 3 차량 상태 정보 car_status_info 19 object 차량 OBD 상태 데이터 1 차량 전압 voltage 3 byte 차량 배터리 전압 2 운전석 도어상태 d_door 1 byte 운전석 도어 on/off 3 조수석 도어상태 p_door 1 byte 조수석 도어 on/off 4 운전석 후석 도어상태 rd_door 1 byte 운전석 후석 도어 on/off 5 조수석 후석 도어상태 rp_door 1 byte 조수석 후석 도어 on/off 6 트렁크 도어 상태 t_door 1 byte 트렁크 도어 on/off 7 차량 시동 engine_status 1 byte 시동 on/off 8 차량 원격시동 r_engine_status 1 byte 원격 시동 on/off 9 차량 경계 상태 stt_alert 1 byte 차량 경계 상태 on/off 10 차량 비상등 el_status 1 byte 비상등 on/off 11 차량 충격감지 detech_shock 1 byte 차량 충격감지 12 차량 원격시동 remain_remote 1 byte 차량 원격시동 유지 여부 13 Auto door 기능사용 autodoor_use 1 byte Auto door on/off 14 차량 무음모드 사용 slience_mode 1 byte 차량 무음모드 on/off 15 저전압 경보 low_voltage_alert 1 byte 배터리 저전압 경보 16 저전압 시동 low_voltage_engine 1 byte 배터리 저전압 시동 17 내부 온도 temperature 2 byte 내부 온도 4 시간 dt 14 long Key-데이터 생성 시간 5 위치 정보 app_location 34 object 사용자 위치 정보 1 도시코드 app_city 3 string 현재 위치한 도시의 코드 2 도시명 app_name 10 string 현재 위치한 도시의 명 3 위도 app_lat 10 double 현재 위치한 위도 4 경도 app_lon 11 double 현재 위치한 경도 5 이전 위도 app_prev_lat 10 double 이전에 위치한 위도 6 이전 경도 app_prev_lon 11 double 이전에 위치한 경도 6 차량 정보 app_car_info 24 Object 차량 정보 1 시동여부 app_engine 1 Integer 차량시동상태 여부 2 운행여부 app_travel 1 boolean 차량 운행 on/off 3 평균속도 app_avg_speed 5 float 10초간 차량 평균 속도 4 가속도 app_accel 5 float 10초간 차량 가속도 5 지자기 app_gradient 5 float 10초간 차량 지자기 6 급가속횟수 app_rapid_acc 2 integer 10초간 차량 급가속 횟수 7 급감속횟수 app_rapid_deacc 2 integer 10초간 차량 급감속 횟수 7 기상 정보 app_wether 5 object App 기반 기상 정보 1 기상 상태 app_wether_status 1 integer App 기반 기상 상태 2 강수(설)량 app_precipitation 4 float App 기반 강수(설)량 8 교통 정보 traffic_data 38 object 교통 정보 1 도로명 roadName 10 String 도로명 2 도로 방향 유형 roadDrcType 5 String 도로 방향 유형 3 통행시간 travelTime 5 String 통행 시간(초) 4 통행속도 speed 4 String 통행 속도(km/h) 5 생성일시 createdDate 14 String YYYYMMDDHH24MISS - 어노테이션 데이터 설명
* 원천 데이터 중 다음과 같이 승하차 이벤트를 만족하는 데이터에 대해 라벨링 작업을 진행
① 시동 상태값(app_car_info/app_engine)이 On(0)으로 변경된 경우
② 시동 상태값(app_car_info/app_engine)이 Off(9)으로 변경된 경우
③ 시동 상태값(app_car_info/app_engine)이 On(0) 또는 주행(1)이고,
도어 상태값(car_status_info/d_door, p_door, rd_door, rp_door, t_door)가 On(1)인 경우
* 승하차 이벤트가 발생한 데이터에 대해 승하차 포인트(app_location/app_lat, app_lon)을 활용하여 다음과 같은 지도 이미지 제작하여 저작도구에 업로드
① 이미지 크기 : 1,920 * 1,080
② 축척 : 1 : 2,000
* 생성한 지도 이미지에 라벨링 기준에 맞게 교통 유발 시설물 태깅한 후 어노테이션 데이터 추가- 어노테이션 데이터 설명 번호 항목 길이 타입 설명 한글명 영문명 1 사용자 정보 user_info 29 obejct 사용자 정보 1 차량 ID car_id 10 string Key-차량 ID 2 성별 user_sex 1 integer 사용자 성별 3 생년 age 8 long 사용자 생년 4 지역 user_location 10 string 사용자 지역 2 차량 정보 user_car_info 17 object 사용자 차량 정보 1 용도 user_car_class 1 integer 차량 용도 정보 2 브랜드 user_car_brand 1 integer 차량 브랜드 정보 3 연식 user_car_year 4 integer 차량 연식 정보 4 차종 user_car_model 1 string 1: 경형, 2: 소형, 3: 준중형 4: 중형, 5: 준대형, 6: 대형, 7: 스포츠카 5 중량 user_car_weight 6 float 차량 중량 6 배기량 user_car_displace 4 integer 차량 배기량 7 연비 user_car_efficiency float 차량 연비 3 차량 상태 정보 car_status_info 19 object 차량 OBD 상태 데이터 1 차량 전압 voltage 3 byte 차량 배터리 전압 2 운전석 도어상태 d_door 1 byte 운전석 도어 on/off 3 조수석 도어상태 p_door 1 byte 조수석 도어 on/off 4 운전석 후석 도어상태 rd_door 1 byte 운전석 후석 도어 on/off 5 조수석 후석 도어상태 rp_door 1 byte 조수석 후석 도어 on/off 6 트렁크 도어 상태 t_door 1 byte 트렁크 도어 on/off 7 차량 시동 engine_status 1 byte 시동 on/off 8 차량 원격시동 r_engine_status 1 byte 원격 시동 on/off 9 차량 경계 상태 stt_alert 1 byte 차량 경계 상태 on/off 10 차량 비상등 el_status 1 byte 비상등 on/off 11 차량 충격감지 detech_shock 1 byte 차량 충격감지 12 차량 원격시동 remain_remote 1 byte 차량 원격시동 유지 여부 13 Auto door 기능사용 autodoor_use 1 byte Auto door on/off 14 차량 무음모드 사용 slience_mode 1 byte 차량 무음모드 on/off 15 저전압 경보 low_voltage_alert 1 byte 배터리 저전압 경보 16 저전압 시동 low_voltage_engine 1 byte 배터리 저전압 시동 17 내부 온도 temperature 2 byte 내부 온도 4 시간 dt 14 long Key-데이터 생성 시간 5 위치 정보 app_location 34 object 사용자 위치 정보 1 도시코드 app_city 3 string 현재 위치한 도시의 코드 2 도시명 app_name 10 string 현재 위치한 도시의 명 3 위도 app_lat 10 double 현재 위치한 위도 4 경도 app_lon 11 double 현재 위치한 경도 5 이전 위도 app_prev_lat 10 double 이전에 위치한 위도 6 이전 경도 app_prev_lon 11 double 이전에 위치한 경도 6 차량 정보 app_car_info 24 Object 차량 정보 1 시동여부 app_engine 1 Integer 차량시동상태 여부 2 운행여부 app_travel 1 boolean 차량 운행 on/off 3 평균속도 app_avg_speed 5 float 10초간 차량 평균 속도 4 가속도 app_accel 5 float 10초간 차량 가속도 5 지자기 app_gradient 5 float 10초간 차량 지자기 6 급가속횟수 app_rapid_acc 2 integer 10초간 차량 급가속 횟수 7 급감속횟수 app_rapid_deacc 2 integer 10초간 차량 급감속 횟수 7 기상 정보 app_wether 5 object App 기반 기상 정보 1 기상 상태 app_wether_status 1 integer App 기반 기상 상태 2 강수(설)량 app_precipitation 4 float App 기반 강수(설)량 8 교통 정보 traffic_data 38 object 교통 정보 1 도로명 roadName 10 String 도로명 2 도로 방향 유형 roadDrcType 5 String 도로 방향 유형 3 통행시간 travelTime 5 String 통행 시간(초) 4 통행속도 speed 4 String 통행 속도(km/h) 5 생성일시 createdDate 14 String YYYYMMDDHH24MISS 9 어노테이션 annotation Array 1 최상단 Y좌표 ytl number BOX 최상단 Y 좌표 2 최상단 X좌표 xtl number BOX 최상단 X 좌표 3 우하단 Y좌표 ybr number BOX 우하단 Y 좌표 4 우하단 X좌표 xbr number BOX 우하단 X 좌표 5 위도 latitude number 교통 유발 시설물 위도 6 경도 longitude number 교통 유발 시설물 경도 7 중첩여부 occluded number 중첩여부(기본값 : 0) 8 라벨명 label String 교통 유발 시설물 Label 명 9 어노테이션 타입 source String Annotation 타입, manual 고정 10 속성 attribute Object 속성 11 프레임 구분 z_order number 프레임 구분(기본값 : 0) 1 속성명(수량) name String 속성명(수량) 2 속성값 content number 수량 값 - 라벨링 데이터 예시
{
"user_info": {
"car_id": "01224824060",
"user_sex": "남",
"age": 30,
"user_location": "서울"
},
"user_car_info": {
"user_car_class": "개인용",
"user_car_brand": "기아",
"user_car_year": 2016,
"user_car_model": "모하비",
"user_car_weight": 2125,
"user_car_displace": 2959,
"user_car_efficiency": 10.3
},
"car_status_info": {
"voltage": 12.2,
"d_door": "0",
"p_door": "0",
"rd_door": "0",
"rp_door": "0",
"t_door": "0",
"engine_status": "1",
"r_engine_status": "0",
"stt_alert": "0",
"el_status": "0",
"detect_shock": "0",
"remain_remote": 0,
"autodoor_use": "0",
"silence_mode": "1",
"low_voltage_alert": "12.2",
"low_voltage_engine": "0",
"temperature": 0.0
},
"dt": 1657395040000,
"app_location": {
"app_city": "",
"app_name": "",
"app_lat": 37.54055126730474,
"app_lon": 126.97097002081287,
"app_prev_lat": 37.54047918175427,
"app_prev_lon": 126.97094741861551
},
"app_car_info": {
"app_engine": 9,
"app_travel": true,
"app_avg_speed": 30.0,
"app_accel": 29.0,
"app_gradient": 0.0,
"app_rapid_acc": 0,
"app_rapid_deacc": 0
},
"app_weather": {
"app_weather_status": 0,
"app_precipitation": 0.0
},
"traffic_data": {
"roadName": "청파로",
"roadDrcType": "",
"trevelTime": "47.3",
"speed": 23,
"createdDate": "20220710041500"
},
"annotation": [
{
"ytl": 504.97,
"xtl": 1069.7,
"ybr": 543.6,
"xbr": 1105.9,
"latitude": 37.54058522234591,
"longitude": 126.97131201276426,
"occluded": 0,
"label": "운수시설",
"source": "manual",
"z_order": 0,
"attribute": {
"name": "수량",
"content": 1
}
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜아로아소프트
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박상면 02-553-5387 [email protected] 총괄책임 및 데이터 검수 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜가린시스템 데이터 수집 KU융합소프트웨어연구센터(주) AI 모델 및 서비스 ㈜맥케이 데이터 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박상면 02-553-5387 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.