콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#AI 학습데이터 # 자율주행 # 특수 차량 # 2D 바운딩박스 # 2.5D 바운딩박스 # 큐보이드

주행 차량 관점의 특수 차량 형상 데이터

주행 차량 관점의 특수 차량 형상
  • 분야교통물류
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2023-11 조회수 : 4,839 다운로드 : 419 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.3 2023-11-02 라벨링데이터 수정
    1.2 2022-10-07 라벨링데이터 수정
    1.1 2022-09-14 Training, Validation > 원천데이터, 라벨링데이터 전체 수정
    1.0 2022-07-29 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2022-10-13 신규 샘플데이터 개방
    2022-07-29 콘텐츠 최초 등록

    소개

    특수 차량(특수차, 화물차, 건설기계) 67종 외관 분류 및 형상을 인식할 수 있는 학습데이터셋

    구축목적

    주행차량 관점에서 특수 차량 객체를 식별할 수 있는 학습데이터 구축
  • 1. 데이터 구축 규모

    • 차종 67종 1,155대 수집, 특수 차량 형상 데이터 1,035,341장 구축 
    • 특수 차량 외관 분류 2D Bounding Box 1,035,341장 구축
    • 특수 차량 객체 인식 2.5D Bounding Box(Cuboid) 517,671장 구축

     

    2. 데이터 분포

    • 구축 데이터 분포
      1. 데이터 구축 규모
      대분류 중분류 소분류ID 소분류 수집량 주행컷 정지컷 합계
      특수차 견인식 M03 견인차 10톤 이상 37 31,102 13,072 44,174
      구난형 M04 구난차(붐방식) 10 5,598 2,520 8,118
      M05 구난차(줄렉카방식) 9 5,535 2,485 8,020
      M06 구난차(언더리프트 방식) 27 22,272 10,072 32,344
      M07 구난차(플랫베드 방식) 10 7,966 3,480 11,446
      M08 구난차(잭리프트 방식) 7 4,000 1,800 5,800
      특수 M09 1톤 고소작업차 9 3,197 3,120 6,317
      용도형 M10 3.5톤 고소작업차 5 2,398 1,800 4,198
        M11 고가사다리차(이삿짐차) 12 9,666 4,106 13,772
        M12 고가사다리소방차 9 0 3,239 3,239
        M13 오가크레인 27 18,810 8,362 27,172
        M67 철스크랩 26 21,620 9,354 30,974
        M68 리프트게이트 17 13,412 6,120 19,532
        M69 포장탑차 23 17,877 8,262 26,139
      승합 M14 구급차 16 0 5,722 5,722
      특수형 M15 장의차 15 10,549 5,042 15,591
        M16 헌혈차 7 0 2,758 2,758
        M17 보도용차 14 800 4,080 4,880
        M70 캠핑카 11 4,753 3,960 8,713
      화물차 덤프형 M18 화물덤프형 1톤 이하 6 3,996 1,800 5,796
      M19 화물덤프형 5톤 미만 19 15,892 5,969 21,861
      M20 화물덤프형 12톤 미만 10 8,924 2,880 11,804
      M21 화물덤프형 12톤 이상 22 18,208 7,920 26,128
      벤형 M22 화물탑차 1톤 이하 50 39,931 17,895 57,826
      M23 화물탑차 5톤 미만 35 29,182 11,940 41,122
      M24 화물윙바디 5톤 미만 36 29,626 12,118 41,744
      M25 화물탑차 5톤 이상 11 9,610 3,895 13,505
      M26 화물윙바디 5톤 이상 29 24,555 10,108 34,663
      특수 M27 청소차(집게차) 11 8,848 3,895 12,743
      용도형 M28 청소차(압축식) 21 17,057 7,380 24,437
        M29 청소차(압롤트럭) 13 9,570 4,320 13,890
        M30 노면청소차 13 9,865 3,540 13,405
        M31 살수차 15 8,999 3,840 12,839
        M32 소방차 14 796 5,037 5,833
        M33 제설차 7 0 2,179 2,179
        M34 냉장, 냉동차 43 35,463 15,381 50,844
        M35 곡물, 사료운반 5 0 1,800 1,800
        M36 유조차 21 16,911 7,199 24,110
        M37 탱크로리 42 33,833 14,640 48,473
        M38 피견인차(적재함형) 6 4,258 2,007 6,265
        M39 피견인차(저상형) 7 3,626 2,270 5,896
        M40 피견인차(평판형) 5 2,418 1,686 4,104
        M41 피견인차(카라반) 4 0 1,919 1,919
      화물 M71 화물카고1톤이하 38 30,221 13,630 43,851
      카고 M72 화물카고5톤미만 43 34,001 15,109 49,110
        M73 화물카고25톤미만 25 20,595 9,349 29,944
        M74 화물카고25톤이상 13 10,277 4,288 14,565
      건설 자주식 M42 굴착기(타이어식) 28 0 11,122 11,122
      기계 M43 로더 31 0 11,425 11,425
        M44 지게차 45 0 15,199 15,199
        M46 기중기 16 0 6,884 6,884
        M47 모터그레이더 13 0 5,640 5,640
        M48 로울러 32 0 11,720 11,720
        M51 콘크리트믹서트럭 15 10,345 5,400 15,745
        M52 콘크리트펌프(붐 펌프) 10 11,074 4,751 15,825
        M54 아스팔트피니셔 14 0 5,777 5,777
        M55 특수건설기계(도로보수트럭) 2 800 740 1,540
        M56 특수건설기계(노면파쇄기) 6 0 2,331 2,331
        M57 특수건설기계 3 0 1,120 1,120
        (터널용 고소작업차)
        M58 불도저(타이어식) 3 0 1,320 1,320
        견인식 M59 굴착기(무한궤도식) 43 0 16,005 16,005
        M60 불도저(무한궤도식) 12 0 4,289 4,289
        M63 공기압축기 14 0 5,040 5,040
        M64 천공기 12 0 4,434 4,434
        M65 항타 및 항발기 1 0 360 360
      합 계 1,155 628,436 406,905 1,035,341
    • 대분류별 구축 수량
      대분류별 구축 수량
      구분 특수차 화물차 건설기계 합계
      수집량(대) 291 564 300 1,155
      데이터셋 278,909 620,656 135,776 1,035,341
    • 중분류별 구축 수량
      중분류별 구축 수량
      특수차 견인식 구난형 승합특수형 특수용도형 합계
      수집량(대) 37 63 63 128 291
      데이터셋 44,174 65,728 37,664 131,343 278,909
      화물차 덤프형 벤형 특수용도형 화물카고 합계
      수집량(대) 57 161 227 119 564
      데이터셋 65,589 188,860 137,470 228,737 620,656
      건설기계 견인식 자주식   합계
      수집량(대) 82 218 300
      데이터셋 30,128 105,648 135,776
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 모델학습

    • 특수차량 종류 구분
      • 학습모델 구조: 머신러닝의 전형적인 지도학습(supervised learning) 설정을 따름 
        • 입력: 1장의 특수 차량 사진
        • 출력: 해당 차량의 종류에 대한 label 정보
      • 이미지 분류 모델 학습을 위해 다양한 계열의 딥러닝 알고리즘 적용 가능
        • 컨벌루션 신경망(CNN) 기반: VGGNet, GoogLeNet, ResNet, EfficientNet, DenseNet 등
        • 트랜스포머(Transformer) 기반:  Vision Transformer (ViT), Data-efficient Image Transformer (DeiT), TransFG 등.
      • 선택한 알고리즘에 데이터를 적용하여 모델 학습 :
        데이터는 취득된 데이터를 다음과 같이 세 그룹으로 구분하여 활용하며, 데이터 구분 시 각 그룹에 포함된 차량 종류 비율이 모두 유사해야 함(stratified 요건)
        1. 모델학습
          학습(Training) 검증(Validation) 시험(Test)
        개요 – 모델 성능 지표를 올리기 위해 입력한 사진과 이에 해당하는 정답 출력값으로 구성된 데이터를 반복적으로 학습하는 과정
        – 일반적으로 데이터를 2의 제곱 단위로 조금씩 묶어서(mini batch, 단위는 4,8,16, 32, ...) 학습에 적용하며, 학습에 사용하는 계산 자원이 클수록 큰 단위를 적용
        – 반복 학습을 통해 성능 개선
        – 딥러닝 모델은 일반적으로 데이터가 많을수록 성능이 개선됨
        – 학습 도중 모델 성과 평가 및 비교
        – 모델의 성과 지표는 알고리즘별로 설정된 학습 가이드 함수(loss function)과 실제 응용에서 고려할 평가 척도를 함께 살펴본다
        – 모델의 학습이 더 필요한지(과소적합), 너무 학습을 많이 하였는지(과적합)를 성과 지표들을 통해 확인
        – 일반적으로 과적합이 시작되는 시점 또는 성과 지표가 수렴하기 시작하는 시점의 모델을 선택
        – 학습 완료된 모델 성능 시험
        – 학습에 사용하지 않은 별개 데이터 적용
        – 검증 단계에서 확인한 모델의 성과 지표뿐만 아니라, 실제 응용 단계에서 고려할 다양한 특성을 만족하는지 확인
        필요
        데이터 
        – 취득 데이터의 80% – 취득 데이터의 10%
        – 차량 종류의 비율이 학습 데이터와 유사해야 함
        – 취득 데이터 10%
        – 차량 종류 비율이 학습 데이터와 유사해야 함
        * ResNet 알고리즘의 파라미터
        * TransFG 알고리즘의 파라미터 
    • 특수차량 큐보이드 탐지
      • 학습모델 구조 : 다음과 같은 설정이 필요함
        • 입력 : 1장의 특수차량 포함 사진
        • 필수 전처리 : 사물 탐지를 통해 다음 경계상자를 인식하여 추가로 입력해야 함. 해당 사진에서 특수 차량 전체에 대한 경계상자(bbox-B), 전문에 대한 경계상자(bbox-F), 후면에 대한 경계상자(bbox-R)
        • 출력 : 특수 차량에 대한 큐보이드 정보
          (3차원 bbox에 준하는 2차원 사진 상의 꼭지점 좌표 정보) 
      • 이러한 모델 학습을 위 차량 전면 및 후면 경게상자 인식을 위한 탐지(object detection) 알고리즘과, 큐보이드 예측을 위한 알고리즘 필요
        • 사물 탐지(object detection) 알고리즘: Yolo 계열 알고리즘(Yolo v3, v5 등), SSD 계열 알고리즘, Faster R-CNN 계열 알고리즘, 트랜스포머 계열(DETR) 알고리즘 등 다양한 선택지 존재
        • 큐보이드 좌표 예측 알고리즘 : 전면 및 후면 경계상자 좌표 정보를 이용하여 물체 vanishing point 계산 후 전체/전면/후면 경계상자와 vanishing point 정보를 바탕으로 최종적으로 객체의 큐보이드 꼭지점 좌표 계산
      • 선택한 알고리즘 데이터를 적용하여 모델 학습:
        데이터는 취득된 데이터를 다음과 같이 세 그룹으로 구분하여 활용하며, 데이터 구분 시 각 그룹에 포함된 차량 종류 비율이 모두 유사해야 함(stratified 요건)
        1. 모델학습
          학습(Training) 검증(Validation) 시험(Test)
        개요 – 모델 성능 지표를 올리기 위해 입력한 사진과 이에 해당하는 정답 출력값으로 구성된 데이터를 반복적으로 학습하는 과정
        – 일반적으로 데이터를 2의 제곱 단위로 조금씩 묶어서(mini batch, 단위는 4,8,16, 32, ...) 학습에 적용하며, 학습에 사용하는 계산 자원이 클수록 큰 단위를 적용
        – 반복 학습을 통해 성능 개선
        – 딥러닝 모델은 일반적으로 데이터가 많을수록 성능이 개선됨
        – 학습 도중 모델 성과 평가 및 비교
        – 모델의 성과 지표는 알고리즘별로 설정된 학습 가이드 함수(loss function)과 실제 응용에서 고려할 평가 척도를 함께 살펴본다
        – 모델의 학습이 더 필요한지(과소적합), 너무 학습을 많이 하였는지(과적합)를 성과 지표들을 통해 확인
        – 일반적으로 과적합이 시작되는 시점 또는 성과 지표가 수렴하기 시작하는 시점의 모델을 선택
        – 학습 완료된 모델 성능 시험
        – 학습에 사용하지 않은 별개 데이터 적용
        – 검증 단계에서 확인한 모델의 성과 지표뿐만 아니라, 실제 응용 단계에서 고려할 다양한 특성을 만족하는지 확인
        필요
        데이터 
        – 취득 데이터의 80% – 취득 데이터의 10%
        – 차량 종류의 비율이 학습 데이터와 유사해야 함
        – 취득 데이터 10%
        – 차량 종류 비율이 학습 데이터와 유사해야 함

    2. 서비스 활용 시나리오

    • 자율 주행 차량을 위한 전용 모델
      • 도로 주행 차량 중 적은 비율이지만 반드시 구분할 필요가 있는 특수차량을 위한 전용 프로그램에 활용
      • 자율 주행 찰야에 연계된 도로 위 사물 인식 시스템의 한 모듈로서 포함됨
    • CCTV 연동 전용 모델
      • 도로 주행 차량 중 적은 비율이지만 반드시 구분할 필요가 있는 특수차량을 위한 전용 프로그램에 활용
      • 자동차 주행 도로에 설치된 CCTV와 연계된 도로 위 사물 인식 시스템의 한 모듈로서 포함됨
    • 블랙박스 영상 자동 분석 전용 모델
      • 사용자 요청에 따라 주행 차량의 블랙박스 자동으로 분석하는 솔루션에 적용
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 특수차량 차종 분류 Image Classification TransFG F1-Score 0.87 0.9899
    2 2.5D 큐보이드 객체 인식 Object Detection TransFG mAP@IoU 0.5 65 % 97.01 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 소개

    • 현재 국내 자율주행을 위한 주행 영상 관점의 이동 객체 학습데이터 구축 현황을 기준으로 보면 차량에 대한 객체 분류에서 특수 차량이 차지하고 있는 비중이 낮은 편이며, 특수 차량의 다양한 형태에 대한 속성 정의 가 미비한 상황. 특히, 자율주행 객체 인식 관점에서 특수 차량은 차제가 크기 때문에 정확히 인식하지 못하는 경우 대형사고로 이어질 수 있음. 따라서 다양한 특수 차량 종류와 객체를 인식할 수 있는 자율주행 알고리즘 개발이 필요함. 이에 주행 차량 관점에서 특수 차량(특수차, 화물차, 건설기계) 67종의 1,000대 이상의 외관을 분류하고, 형상을 인식할 수 있는 학습데이터를 구축함

     

    2. 대표도면

    1. 데이터 소개
    구분 원천데이터 라벨링데이터
    2D 주행 차량 관점의 특수 차량 형상-대표도면_1_원천데이터(1) 주행 차량 관점의 특수 차량 형상-대표도면_2_라벨링데이터(1)
    Bounding Box
    2.5D 주행 차량 관점의 특수 차량 형상-대표도면_3_원천데이터(2) 주행 차량 관점의 특수 차량 형상-대표도면_4_라벨링데이터(2)
    Bounding
    Box
    (Cuboid)
    형식 jpg json

     

    • 원천데이터
      • 특수차량 외관 360도를 촬영한 원시데이터(mp4)에서 추출한 이미지(jpg) 데이터
    • 라벨링데이터
      • 원천데이터(jpg)에 특수차량 외관 분류를 위해 2D Bounding Box 처리 데이터
      • 원천데이터(jpg)에 특수차량 형상인식을 위해 2.5D Bounding Box(Cuboid) 처리 데이터

     

    3. 라벨링 데이터 구성

    주행 차량 관점의 특수 차량 형상-라벨링 데이터 구성_1주행 차량 관점의 특수 차량 형상-라벨링 데이터 구성_2


    4. 라벨링 데이터 예시

    •  {
          "rawDataInfo": {
              "rawDataID": "P_210810_P_01_M03_11_01_D",
              "copyrighter": "㈜미디어그룹사람과숲",
              "resolution": "1920*1080",
              "date": "2021-08-10",
              "StartTime": "11:37:47",
              "EndTime": "11:54:55",
              "length": 1028,
              "season": "Summer",
              "weather": "Sunny",
              "precip": 0,
              "temp": 29,
              "condition": "Driving",
              "fps": 10,
              "fStop": "F/13",
              "exposureTime": "10/600",
              "ISO": 200,
              "LargeCategoryId": "특수차",
              "MediumCategoryId": "견인식(특수차)",
              "SmallCategoryId": "견인차 10톤 이상",
              "fileExtension": "mp4"
          },
          "sourceDataInfo": {
              "sourceDataID": "P_210810_P_01_M03_11_01_D_0066",
              "fileExtension": "jpg"
          },
          "learningDataInfo": {
              "path": null,
              "LearningDataId": "P_210810_P_01_M03_11_01_D_0066",
              "fileExtension": "json",
              "objects": [
                  {
                      "annotation": "cuboid",
                      "front": {
                          "points": [
                              {
                                  "x": 1336.0551053622298,
                                  "y": 316.75915511374444
                              },
                              {
                                  "x": 1575.3170384346786,
                                  "y": 316.75915511374444
                              },
                              {
                                  "x": 1575.3170384346786,
                                  "y": 594.2373346008391
                              },
                              {
                                  "x": 1336.0551053622298,
                                  "y": 594.2373346008391
                              }
                          ]
                      },
                      "back": {
                          "points": [
                              {
                                  "x": 1224.9132507821223,
                                  "y": 317.6759883997338
                              },
                              {
                                  "x": 1463.4432507821225,
                                  "y": 317.6759883997338
                              },
                              {
                                  "x": 1463.4432507821225,
                                  "y": 673.2859883997338
                              },
                              {
                                  "x": 1224.1431807321214,
                                  "y": 668.8337598960768
                              }
                          ]
                      }
                  },
                  {
                      "annotation": "bbox",
                      "coords": {
                          "tl": {
                              "x": 1227.073258081839,
                              "y": 321.90999999999997
                          },
                          "tr": {
                              "x": 1573.5713625536132,
                              "y": 321.90999999999997
                          },
                          "bl": {
                              "x": 1227.073258081839,
                              "y": 642.4699999999999
                          },
                          "br": {
                              "x": 1573.5713625536132,
                              "y": 642.4699999999999
                          }
                      },
                      "left": 1227.073258081839,
                      "top": 321.90999999999997,
                      "width": 346.49810447177407,
                      "height": 320.56,
                      "angle": 0
                  }
              ]
          }
      }
       
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜미디어그룹사람과숲
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    성낙춘 02-830-8583 [email protected] · 데이터 구축 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜스프링클라우드 · 데이터 수집·정제
    ㈜크라우드웍스 · 데이터 가공
    ㈜미디어그룹사람과숲 · 데이터 가공
    한국자동차연구원 · 데이터 품질 검수
    ㈜써로마인드 · AI 모델 개발
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    성낙춘 02-830-8583 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.