콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#멀티AI # 한국형 # 대규모 # 비전 # 객체 분류 # 객체 탐지 # 객체 관계 인지

객체 인식용 한국형 비전 데이터

객체 인식용 한국형 비전 데이터 아이콘 이미지
  • 분야영상이미지
  • 유형 텍스트 , 이미지
구축년도 : 2022 갱신년월 : 2023-11 조회수 : 4,911 다운로드 : 291 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-11-17 데이터 최종 개방
    1.0 2023-07-31 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-22 산출물 전체 공개

    소개

    한국 상황을 잘 설명할 수 있는 한국형 객체인식 데이터셋 구축하기 위해 300만장의 이미지의 객체를 바운딩 박스 처리로 인식함

    구축목적

    한국의 지리적 요건 및 객체 특수성을 충족하는 대규모 비전 데이터를 구축하여, 객체인식 분야의 지리적 편향을 해결한 한국형 이미지를 생성하고 구축 대상기반 편향을 해결할 데이터를 확보
  • □ 데이터 구축 규모
      ㅇ 원시 및 원천 데이터: 영상 1,225건 / 이미지 3,436,368장 수집
      ㅇ 가공 및 검수 데이터: object 152건


    □ 데이터 분포
      ㅇ 원시 데이터
    ­ 
    Super Category별 수집 구분

    □ 데이터 분포ㅇ 원시 데이터 ­Super Category별 수집 구분
    Super Category별 수집 구분
    Category 카테고리 목표수량 달성수량 퍼센트(%)
    person 사람 600,000 669,464 111.60%
    vehicle 탈것 105,000 118,749 113.10%
    outdoor 실외 85,000 97,983 115.30%
    animal 동물 45,000 50,175 111.50%
    accessory 액세서리 80,000 92,448 115.60%
    sports 스포츠 330,000 401,180 121.60%
    kitchen 주방 455,000 513,339 112.80%
    fruits 과일 180,000 212,589 118.10%
    vegetable 채소 325,000 364,024 112.00%
    food(western) 음식(서양) 90,000 108,846 120.90%
    food(eastern) 음식(동양) 110,000 139,833 127.10%
    furniture 가구 140,000 155,057 110.80%
    toilet 화장실 30,000 33,913 113.00%
    indoor 실내 65,000 71,754 110.40%
    electronic 전자기기 170,000 194,795 114.60%
    musical instrument 악기 150,000 164,800 109.90%
    medical equipment 의료기기 40,000 47,419

    118.50%

     

    Instance별 수집 구분

    □ 데이터 분포ㅇ 원시 데이터 Instance별 수집 구분
    Instance별 수집 구분
    인스턴스 카테고리 목표수량 달성수량
    001.person(person) 사람 600,000 669,464
    002.bicycle(bicycle) 탈것 10,000 11,104
    003.car(sedan) 탈것 5,000 6,109
    004.car(suv) 탈것 5,000 6,203
    005.car(pickup) 탈것 5,000 5,655
    006.car(police_car) 탈것 5,000 6,431
    007.car(ambulance) 탈것 20,000 21,395
    008.motorcycle(motorcycle(normal)) 탈것 10,000 11,712
    009.motorcycle(motorcycle(delivery)) 탈것 10,000 11,184
    010.scooter(scooter) 탈것 20,000 21,261
    011.bus(bus) 탈것 10,000 11,661
    012.truck(truck) 탈것 5,000 6,034
    013.traffic_light(traffic_light) 실외 10,000 11,190
    014.fire_hydrant(fire_hydrant(outside)) 실외 5,000 6,261
    015.fire_extinguisher(fire_extinguisher) 실외 10,000 11,089
    016.sign(warning_sign) 실외 5,000 6,207
    017.sign(direction_sign) 실외 5,000 6,111
    018.sign(restriction_sign) 실외 5,000 7,054
    019.trash_bin(trash_bin) 실외 20,000 21,224
    020.bench(bench) 실외 5,000 7,377
    021.roof(hanok_roof) 실외 20,000 21,470
    022.bird(bird) 동물 10,000 11,138
    023.cat(cat) 동물 10,000 11,255
    024.dog(dog) 동물 5,000 6,712
    025.chicken(chicken) 동물 20,000 21,070
    026.backpack(backpack) 액세서리 5,000 6,431
    027.umbrella(umbrella) 액세서리 10,000 11,219
    028.handbag(handbag) 액세서리 5,000 6,056
    029.tie(tie) 액세서리 10,000 11,100
    030.suitcase(suitcase) 액세서리 10,000 11,592
    031.muffler(muffler) 액세서리 20,000 24,863
    032.hat(hat) 액세서리 20,000 21,187
    033.ball(football) 스포츠 5,000 6,092
    034.ball(golfball) 스포츠 5,000 6,760
    035.ball(baseball) 스포츠 5,000 6,135
    036.ball(tennisball) 스포츠 5,000 6,215
    037.ball(basketball) 스포츠 5,000 6,144
    038.ball(pilates_ball) 스포츠 5,000 6,025
    039.ball(billiards_ball) 스포츠 5,000 7,256
    040.poles(poles) 스포츠 20,000 56
    041.plate(skis) 스포츠 20,000 37
    042.board(board) 스포츠 5,000 28
    043.drone(drone) 스포츠 10,000 12,222
    044.pilates_equipment(foam_roller) 스포츠 20,000 22,525
    045.pilates_equipment(band) 스포츠 10,000 11,836
    046.treadmill(treadmill) 스포츠 20,000 28,640
    047.dumbbell(dumbbell) 스포츠 20,000 21,780
    048.golf_club(golf_club) 스포츠 20,000 23,735
    049.billiards_cue(billiards_cue) 스포츠 20,000 21,890
    050.skating_shoes(skating_shoes) 스포츠 20,000 20,985
    051.tennis_racket(tennis_racket) 스포츠 10,000 11,149
    052.badminton_racket(badminton_racket) 스포츠 20,000 21,699
    053.goalpost(goalpost) 스포츠 20,000 23,601
    054.basketball_hoop(basketball_hoop) 스포츠 20,000 24,182
    055.carabiner(carabiner) 스포츠 20,000 21,992
    056.table_tennis_racket(table_tennis_racket) 스포츠 20,000 39,974
    057.rice_cooker(steamer_rice_cooker) 주방 5,000 5,909
    058.rice_cooker(electric_rice_cooker) 주방 20,000 21,277
    059.gas_stove(gas_stove) 주방 20,000 21,108
    060.pot(pot) 주방 20,000 20,798
    061.pan(pan) 주방 20,000 24,072
    062.microwave(microwave) 주방 5,000 6,136
    063.toaster(toaster) 주방 5,000 8,448
    064.knives(knives) 주방 20,000 21,036
    065.chopping_boards(chopping_boards) 주방 20,000 20,943
    066.ladle(ladle) 주방 20,000 23,997
    067.silicon_spatula(silicon_spatula) 주방 20,000 21,927
    068.rice_spatula(rice_spatula) 주방 20,000 21,648
    069.vegetable_peeler(vegetable_peeler) 주방 20,000 21,021
    070.box_grater(box_grater) 주방 5,000 6,248
    071.scissors(scissors) 주방 20,000 21,683
    072.bowl(bowl) 주방 5,000 6,189
    073.bowl(mixing_bowl) 주방 5,000 6,014
    074.bowl(earthenware_bowl) 주방 5,000 6,050
    075.bowl(jar) 주방 5,000 6,086
    076.bowl(colander) 주방 5,000 6,082
    077.cutlery(spoon) 주방 5,000 5,209
    078.cutlery(chopsticks) 주방 20,000 21,496
    079.cutlery(knife) 주방 5,000 6,406
    080.cutlery(fork) 주방 5,000 6,565
    081.plate(plate) 주방 20,000 21,062
    082.side_dish(side_dish) 주방 20,000 21,086
    083.tray(tray) 주방 20,000 22,605
    084.mug(mug) 주방 20,000 21,476
    085.refrigerator(refrigerator(normal)) 주방 5,000 5,994
    086.refrigerator(gimchi_refrigerator) 주방 10,000 555
    087.dish_washer(dish_washer) 주방 20,000 3,142
    088.espresso_machine(espresso_machine) 주방 20,000 21,113
    089.purifier(purifier) 주방 20,000 21,344
    090.banana(banana) 과일 20,000 21,156
    091.apple(apple) 과일 5,000 6,060
    092.grape(grape) 과일 20,000 22,770
    093.pear(pear) 과일 20,000 23,135
    094.melon(melon) 과일 20,000 21,154
    095.cucumber(cucumber) 과일 20,000 22,406
    096.watermelon(watermelon) 과일 20,000 21,134
    097.orange(orange) 과일 5,000 6,064
    098.orange(tangerine) 과일 5,000 6,121
    099.orange(hallabong) 과일 10,000 267
    100.peach(peach) 과일 5,000 6,395
    101.strawberry(strawberry) 과일 5,000 305
    102.plum(plum) 과일 20,000 22,176
    103.persimmon(persimmon) 과일 5,000 6,305
    104.lettuce(lettuce) 채소 20,000 21,201
    105.cabbage(cabbage) 채소 20,000 21,348
    106.radish(radish) 채소 20,000 23,727
    107.perilla_leaf(perilla_leaf) 채소 20,000 22,612
    108.garlic(galic(normal)) 채소 10,000 11,578
    109.garlic(galic(opened)) 채소 10,000 11,086
    110.onion(onion) 채소 20,000 21,426
    111.spring_onion(spring_onion) 채소 20,000 22,685
    112.carrot(carrot) 채소 5,000 6,057
    113.corn(corn) 채소 20,000 23,111
    114.potato(potato) 채소 20,000 21,506
    115.sweet_potato(sweet_potato) 채소 20,000 21,137
    116.egg_plant(egg_plant) 채소 20,000 21,931
    117.tomato(tomato) 채소 20,000 21,981
    118.pumpkin(pumpkin) 채소 20,000 23,154
    119.squash(squash) 채소 20,000 21,969
    120.chili(chili) 채소 20,000 21,413
    121.pimento(pimento) 채소 10,000 12,696
    122.pimento(paprika) 채소 10,000 13,406
    123.sandwich(sandwich) 음식(서양) 10,000 11,709
    124.hamburger(hamburger) 음식(서양) 10,000 11,897
    125.hotdog(hotdog) 음식(서양) 5,000 6,014
    126.pizza(pizza) 음식(서양) 10,000 11,931
    127.donut(donut) 음식(서양) 5,000 6,165
    128.cake(cake) 음식(서양) 10,000 13,320
    129.cake(pancake) 음식(서양) 10,000 12,598
    130.cake(cupcake) 음식(서양) 10,000 12,957
    131.white_bread(white_bread) 음식(서양) 10,000 11,186
    132.icecream(icecream) 음식(서양) 10,000 11,069
    133.ttoke(garaettoke) 음식(동양) 10,000 11,129
    134.ttoke(songpyun) 음식(동양) 10,000 11,377
    135.tteokbokki(tteokbokki) 음식(동양) 10,000 13,556
    136.kimchi(kimchi) 음식(동양) 10,000 12,340
    137.kimchi(kimchi(bachelor)) 음식(동양) 5,000 6,073
    138.kimchi(kimchi(radish)) 음식(동양) 5,000 7,872
    139.gimbap(gimbap) 음식(동양) 10,000 11,077
    140.gimbap(triangle_gimbap) 음식(동양) 10,000 12,728
    141.sushi(sushi) 음식(동양) 10,000 18,587
    142.sushi(tofu_sushi) 음식(동양) 10,000 12,232
    143.mandu(mandu) 음식(동양) 10,000 11,776
    144.gonggibap(gonggibap) 음식(동양) 10,000 11,086
    145.couch(couch) 가구 5,000 5,921
    146.mirror(mirror) 가구 20,000 22,750
    147.window(window) 가구 20,000 21,029
    148.table(table) 가구 30,000 33,227
    149.table(desk) 가구 10,000 12,764
    150.lamp(lamp) 가구 20,000 21,660
    151.door(door) 가구 20,000 20,932
    152.chair(chair) 가구 5,000 6,138
    153.bed(bed) 가구 10,000 10,636
    154.toilet_bowl(toilet_bowl) 화장실 10,000 12,621
    155.washstand(washstand) 화장실 20,000 21,292
    156.book(book) 실내 5,000 5,515
    157.clock(clock(table)) 실내 5,000 6,059
    158.clock(clock(wall)) 실내 5,000 5,981
    159.doll(doll) 실내 20,000 21,160
    160.hair_drier(hair_drier) 실내 5,000 6,214
    161.toothbrush(toothbrush) 실내 5,000 5,741
    162.hair_brush(hair_brush) 실내 20,000 21,084
    163.tv(tv) 전자기기 5,000 6,237
    164.laptop(laptop) 전자기기 10,000 11,003
    165.mouse(mouse) 전자기기 5,000 6,136
    166.keyboard(keyboard) 전자기기 10,000 11,388
    167.cell_phone(cell_phone) 전자기기 40,000 40,970
    168.watch(watch(normal)) 전자기기 10,000 11,063
    169.watch(smartwatch) 전자기기 10,000 11,182
    170.camera(camera) 전자기기 20,000 26,142
    171.speaker(speaker) 전자기기 20,000 21,303
    172.fan(fan(stand)) 전자기기 5,000 6,139
    173.fan(fan(wall)) 전자기기 5,000 6,084
    174.fan(fan(fanless)) 전자기기 5,000 8,168
    175.fan(fan(handy)) 전자기기 5,000 6,216
    176.air_conditioner(air_conditioner(stand)) 전자기기 10,000 11,001
    177.air_conditioner(air_conditioner(ceiling)) 전자기기 10,000 11,763
    178.piano(piano) 악기 20,000 21,320
    179.tambourine(tambourine) 악기 5,000 6,066
    180.castanets(castanets) 악기 5,000 6,101
    181.guitar(guitar) 악기 20,000 21,020
    182.violin(violin) 악기 20,000 20,994
    183.flute(flute) 악기 20,000 21,499
    184.recorder(recorder) 악기 20,000 23,615
    185.xylophone(xylophone) 악기 20,000 21,920
    186.ocarina(ocarina) 악기 20,000 22,265
    187.thermometer(thermometer) 의료기기 20,000 22,045
    188.sphygmomanometer(sphygmomanometer) 의료기기 5,000 6,161
    189.blood_glucose_meter(blood_glucose_meter) 의료기기 5,000 6,657
    190.defibrillator(defibrillator) 의료기기 5,000 6,524
    191.massage_gun(massage_gun) 의료기기 5,000 6,032
    040.shuttlecock(shuttlecock) 스포츠 20,000 21,381
    041.hulahoop(hulahoop) 스포츠 20,000 22,618
    042.gripper(gripper) 스포츠 5,000 6,223
    086.whisk(whisk) 주방 10,000 12,097
    087.tongs(tongs) 주방 20,000 26,517
    099.jujube(jujube) 과일 10,000 16,819
    101.chestnuts(chestnuts) 과일 5,000 10,322
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    □ 활용 모델
      ㅇ 객체 탐지
    ­      다양한 객체 탐지 모델 중 YOLO 시리즈를 선택함. 기존의 탐지 모델들보다 학습 파이프라인이 간단하면 학습과 예측의 속도가 빠른 장점임. 여러 YOLO 모델 중 YOLOv7을 선택함. 몇 가지 요소가 추가되어 속도와 정확성이 다른 모델보다 높아짐
      ㅇ 객체 분류
    ­      트랜스포머가 효율적으로 적용된 Swin(Shifted WINdow Transformer)을 사용하였으며 큰 해상도 이미지에도 적용인 가능한 SwinV2를 선택함. 고해상도 이미지에 적용할 수 있으며 GPU 메모리 사용량을 줄이기 위한 다양한 기법이 적용됨

     

    □ 활용 서비스 분야
      ㅇ 객체 분류 기술을 이용한 식당 음식 인식 서비스
      ㅇ 객체 분류 기술을 이용한 제조 현장 장비 식별 서비스
      ㅇ 객체 탐지 기술을 이용한 재해 현장 드론 기반 생존자 수색 서비스

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 객체, 전경 및 배경 인스턴스 세그멘테이션 성능 Segmentation swin-transformer mAP 54.5 % 63.5 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    □ 어노테이션 포맷

    □ 어노테이션 포맷
    구분 항목 필수 비고
    항목명 타입 설명 여부
    1   info Object 데이터셋 정보    
    1-1 info.description String 데이터셋 명칭 Y  
    1-2 info.version String 데이터셋 버전 Y 1
    1-3 info.year String 데이터셋생성년도 Y 2022
    1-4 info.main_category String 메인객체(object) Y 152개 메인 카테고리명(오브젝트)
    2   Categories Arr[Obj] 카테고리 정보    
    2-1 Categories[].supercategory String 카테고리 대분류 Y 17개 super category (class) + stuff 추가
    2-2 Categories[].id String 카테고리 아이디 Y 152개 main Categories (object) ID + stuff 추가
    2-3 Categories[].name String 메인카테고리 Y 152개 main Categories (object)이름 + stuff 추가
    3   images Arr[Obj] 이미지 정보    
    3-1 images[].id String 이미지 식별자 Y  
    3-2 images[].width Number 이미지 너비 Y  
    3-3 images[].height Number 이미지 높이 Y  
    3-4 images[].file_name String 이미지파일명 Y  
    5ᅠ   annotations Arr[obj] 어노테이션 정보    
    5-1 annotations[].id Number 어노테이션ID Y  
    5-2 annotations[].image_id Number 이미지ID Y  
    5-3 annotations[].category_id Number 카테고리ID Y  
    5-4 annotations[].iscrowd Number 객체끼리의 그룹 Y 0, 1
    5-5 annotations[].bbox Arr[Number] 객체 Bounding Box 정보 Y [x, y, width, height]
    5-6 annotations[].segmentation Arr[Arr[Number]] 객체 segmentation 정보 Y [[x1, y1, x2, y2….],[...],[...],...]
    5-7 annotations[].area Number 객체 segmentation어노테이션 면적 Y 759.12

     

    □ 라벨링 데이터 실제 예시

    라벨링 데이터 실제 예시 1

     

    라벨링 데이터 실제 예시 2

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜메트릭스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    박두진 02-6244-0791 [email protected] 과제 총괄 책임자
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜더바이럴 수집/정제
    ㈜에프아이솔루션 가공/검수
    울산과학기술원 모델링
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    박두진 02-6244-0791 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.