콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#객체 인식

장애물에 가려진 물체 형상 추정 데이터

장애물에 가려진 물체 형상 추정 데이터
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 4,692 다운로드 : 44 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-14 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2022-10-13 신규 샘플데이터 개방
    2022-07-14 콘텐츠 최초 등록

    소개

    장애물(예, 철조망, 유리창 등)에 가려지거나 후방에 존재하는 객체의 인식률 향상 및 텍스쳐 바이어스(Texture-bias)를 줄이기 위한 장애물에 가려진 데이터셋 구축

    구축목적

    - 자율주행, 로보틱스 등에서 사용이 확대되고 있는 객체 인식 기술은 객체가 장애물에 가려질 경우 텍스쳐 바이어스로 인한 오인식 등의 문제로 인식 정확도가 떨어짐. 해당 문제를 해결하여 객체 인식 성능을 높이기 위한 장애물(예, 철조망, 유리창 등)에 가려진 객체로 구성된 데이터셋 확보 필요
    - 객체 인식 기술, 객체 형태 추정 및 재구축 기술, 인페인팅 기술 등 전반적인 객체 인식 및 검출 네트워크 학습에 활용될 수 있는 데이터 확보
  • 1. 데이터 구축 규모

    1. 데이터 구축 규모
    구분 상세 형식 총 수량
    원천 이미지 200종 객체 카테고리와 객체당 2,000장 이상의 장애물에 가려진/가려지지 않은 객체를 촬영한 이미지 및 라벨링 데이터 JPG 431,120
    폴리곤 좌표값 JSON 431,120
    촬영 메타 정보 JSON 431,120

     

     

    2. 데이터 분포

    2. 데이터 분포
    항목 조건구분 비율(%)
    클래스별 이미지 분포 객체 200종 0.46~0.83% (2,000~3,570)
    총계 100.0% ( 총 431,120건)
    장애물 환경별 이미지 분포 장애물 없음 20.00%
    장애물 - 반투명 20.00%
    장애물 - 촘촘한 망 20.00%
    장애물 - 중간 간격 망 20.00%
    장애물 – 느슨한 망 20.00%
    총계 100.0% (총 431,120건)
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    □ 모델학습
    1. 객체 인식 모델(Classification)

    • 학습에 방해가 되는 gradient vanishing 현상을 모델에 residual learning을 추가하여 해결하고 좋은 성능을 발휘하게 하는 ResNet50 모델을 사용
    • 모델의 convolution layer를 pytorch의 kaiming_normal 함수를 사용하여 초기화하고, BatchNorm layer는 bias 값을 0, weight 값은 1로 초기화함.모델 학습에 사용된 optimizer는 SGD이며 초기 learning rate는 1e-3으로 시작함. scheduler는 pytorch의 CosineAnnealingLR을 사용하였으며, minimum learning rate은 1e-4임.모델은 총 50 epoch동안 학습되며, 1 epoch 마다 validation dataset으로 평가하여 validation dataset기준 top-1 accuracy가 가장 높은 model을 최종 test dataset 평가에 사용

    2. Semantic Segmentation 모델

    • Semantic Segmentation Task를 학습하기 위해, 현재 다양한 Computer Vision 분야에서 높은 성능을 내는 최신 state-of-the-art model 중 하나인 BEIT model 사용

    장애물에 가려진 물체 형상 추정-모델학습_1_Semantic Segmentation 모델

     

    • 모델의 backbone 모듈의 linear layer weight은 truncated normal distribution을 사용하여 초기화하고 bias는 0으로 초기화함. LayerNorm layer는 bias 값을 0으로, weight 값은 1로 초기화함. Decoder module의 convolution layer는 xavier uniform distribution을 사용하여 초기화함. 모델 학습에 사용된 optimizer로 AdamW를 사용했으며 초기 learning rate는 3e-5에서 시작하며, beta 값은 (0.9, 0.999), eps 값은 1e-8 weight_decay 값은 0.01을 사용함.scheduler는 polynomial learning rate decay scheduler를 사용하였으며, minimum learning rate은 0.0임. 학습의 안정성을 위해 1500 iteration동안 linear warmup을 추가함. 모델은 총 320,000 iteration 동안 학습됨

    □ 서비스 활용 시나리오
    텍스쳐 바이어스를 해결하게 되면 다음과 같은 분야에서 영상 인식 기술 이용이 더욱 활성화 될 수 있음

    • 자율 주행 중 표지판 인식 기술 성능 개선
    • 로보틱스에 적용하여 로봇의 객체 인식 성능 정확도 개선
    • 스마트 CCTV를 이용한 보안 시스템 등 장애물로 인한 텍스쳐 바이어스가 발생할 가능성이 높은 인식 상황을 처리하는 AI 응용서비스 일체
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 객체인식 정확도 Object Detection ResNet50 AccuracyTop-1 60 % 99.74 %
    2 세그멘테이션 정확도 Segmentation BEiT mAP 25 % 33.84 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    □ 데이터 구축

    • (수집) ImageNet 기반으로 국내에서의 수집 적합성 확인 후 200종 객체 카테고리 선정 후 각 카테고리별로 100개의 물체 인스턴스 촬영. 각 인스턴스당 5종류의 장애물(장애물 없음 None, 반투명 Semi-transparent, 촘촘한 망 Wire-dense, 중간 간격 망 Wire-medium, 느슨한 망 Wire-Loose)를 변경하면서 4 방향에서 수집
    •  (정제) 원시데이터 검수 기준에 따라 촬영 이미지 품질 검수(반려된 이미지는 재촬영 후 재검수 진행) 및 얼굴, 전화번호, 자동차 번호판 등 개인정보 또는 민감정보에 대한 비식별화 작업 진행 
    •  (가공) 객체의 가시 영역 외곽선을 따라 점을 찍어 다각형 모양으로 그리는 폴리곤 라벨링 진행
    • (검수) 폴리곤 라벨링에 대해 육안 검수 후 통과 또는 반려함. 반려된 작업물은 재작업 후 다시 검수 과정을 거침

    장애물에 가려진 물체 형상 추정-데이터 구축_1

    □ 데이터 구축
    No. 클래스 No. 클래스 No. 클래스 No. 클래스 No. 클래스
    1 AirFryer 41 DigitalDoorlock 81 Iron 121 Perfume 161 SportsBall
    2 AirtightContainer 42 DiningTable 82 Jug 122 PillBottle 162 Sprayer
    3 Apple 43 DishDrainer 83 Ketchup 123 Pillow 163 Stapler
    4 Backpack 44 Dishsoap 84 Kleenex 124 Pizza 164 Stove
    5 Banana 45 DisposableMask 85 Knife 125 Plate 165 Suitcase
    6 BandAid 46 Doll 86 Ladle 126 Plunger 166 Sunglasses
    7 BathMat 47 DoorHandle 87 Laptop 127 Pole 167 Sunscreen
    Computer
    8 BeanCurd 48 Dumbbell 88 Laundry 128 PopBottle 168 Supplementary
    Detergent Battery
    9 BeerBottle 49 ElectricFan 89 Lemon 129 Popsicle 169 SweatShirt
    10 BellPepper 50 ElectricKettle 90 Loaf 130 Pot 170 TabletPC
    11 Bicycle 51 Electric 91 Loafer 131 Potato 171 Tape
    RiceCooker
    12 Blender 52 ElectricSwitch 92 Lotion 132 Printer 172 Teacup
    13 Book 53 Envelope 93 Macaron 133 Projector 173 Teapot
    14 Broccoli 54 EspressoMaker 94 Magnifier 134 Puncher 174 Television
    15 Broom 55 Eyepatch 95 Mailbag 135 Ramen 175 Thermometer
    16 Brush 56 FacePowder 96 Mailbox 136 Razor 176 Tie
    17 Bucket 57 Fan 97 Manhole 137 Remote 177 Toaster
    Cover Control
    18 Cabbage 58 Flashlight 98 MicroPhone 138 RiceScoop 178 Toilet
    19 Calculator 59 FlowerPot 99 Microwave 139 RiceSoup 179 ToiletTissue
    Bowl
    20 Camera 60 Fluorescent 100 Milk 140 RubberEraser 180 Tomato
    Lamp
    21 Can 61 Fork 101 Mitten 141 Ruler 181 Toolkit
    22 Cardigan 62 Frame 102 MixingBowl 142 RunningShoe 182 Toothbrush
    23 Carrot 63 Frypan 103 Mobilephone 143 SaltShaker 183 Toothpaste
    24 CarSideMirror 64 FuseBox 104 Monitor 144 Sandal 184 Towel
    25 Carwheel 65 HairBand 105 Mop 145 Scale 185 Tray
    26 Cereal 66 HairBrushComb 106 Mosquitocide 146 Scissors 186 T-shirt
    27 Chair 67 HairDryer 107 MotorScooter 147 ScouringPad 187 Umbrella
    28 Cheese 68 HairSpray 108 Muffler 148 Screwdriver 188 USB
    29 Chopping 69 Hamburger 109 Mug 149 SesameOil 189 Vase
    Board
    30 Cigarettes 70 Hammer 110 Mushroom 150 Sewer 190 Wallet
    Drainage
    31 Clock 71 Handbag 111 One-piece 151 Shampoo 191 Washbasin
    32 Coat 72 Hanger 112 Orange 152 Shopping 192 Wastebin
    Cart
    33 Computer 73 Hankerchief 113 Pants 153 ShowerHead 193 Watch
    Keyboard
    34 Computer 74 Hat 114 PaperBag 154 Skirt 194 WaterBottle
    Mouse
    35 CookingOil 75 Headphone 115 Paper 155 Slippers 195 WaterPurifier
    Notebook
    36 Corn 76 Hotdog 116 ParkBench 156 Soap 196 WetTissue
    37 Cucumber 77 Hourglass 117 Pen 157 Sock 197 Whisk
    38 Cucurbita 78 HwatuCard 118 PencilCase 158 Spatula 198 WineBottle
    39 DeskLamp 79 Icecream 119 Pencil 159 Speaker 199 Wineglass
    Sharpener
    40 Desktop 80 InstantRice 120 PennyBank 160 Spoon 200 Wok
    Computer

     

     

    □ 대표도면

    장애물에 가려진 물체 형상 추정-대표도면_1

     

    □ 라벨링데이터 구성

    • 폴리곤 좌표값 JSON 항목
    폴리곤 좌표값 JSON 항목
    구분 항목명 타입 필수여부 설명 범위
    1 additional object      
    Information
    1.1 s3Url string   원본이미지  
    저장경로
    1.2 imageName string Y 원본이미지  
    파일명
    2 figures array      
    2.1 id number Y 각각의 폴리곤에 대한 id값 1~100
    2.2 type string   형태 관련 좌표값임을 명시 shape
    2.3 label string Y 레이블 관련 정보 명시 polygon
    2.4 shape object      
    2.4.1 keyframe boolean      
    2.4.2 type string Y 레이블 관련 정보 명시 polygon
    2.4.3 occluded boolean      
    2.4.4 coordinates array Y 폴리곤 좌표값을 포함하는 항목  
      └$value$ number Y 폴리곤 점(point)   
    (x.y) 좌표값
    2.5 attributes array      
    2.6 displayIndex number      
    3 attributes array      

     

     

    • 메타정보 JSON 항목
    메타정보 JSON 항목
    구분 항목명 타입 필수여부 설명 범위
    1 class String Y 클래스명 200종
    2 occluder String Y 장애물 종류 5종

     

     

    □ 라벨링데이터 실제예시

    • 폴리곤 좌표값 JSON 항목

    장애물에 가려진 물체 형상 추정-라벨링데이터 실제예시_1_폴리곤 좌표값 JSON 항목

     

    • 메타정보 JSON 항목

    장애물에 가려진 물체 형상 추정-라벨링데이터 실제예시_2_메타정보 JSON 항목

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜씨유박스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    박준석 02-6277-7835 [email protected] 데이터 설계, 수집 및 정제, 품질 관리, 학습 모델 개발
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜딥핑소스 데이터 가공 및 검수, 저작도구 개발
    ㈜인터마인즈 데이터 수집 및 정제
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    박준석 02-6277-7835 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.