-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-11-17 데이터 최종 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-03-29 AI모델 및 AI모델 설치가이드 수정 2023-12-22 산출물 전체 공개 소개
한국 상황을 잘 설명할 수 있는 한국형 객체인식 데이터셋 구축하기 위해 300만장의 이미지로부터 한글/영문 각 10개의 설명문을 도출함
구축목적
한국의 지리적 요건 및 객체 특수성을 충족하는 대규모 비전 데이터를 구축하여, 객체인식 분야의 지리적 편향을 해결한 한국형 이미지를 생성하고 구축 대상기반 편향을 해결할 데이터를 확보
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 텍스트 , 이미지 데이터 형식 jpg 데이터 출처 자체 수집 라벨링 유형 텍스트(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 1) 시각 장애우들에게 화면을 설명해줄 수 있는 문장 생성 2) 여러 그림 작품을 학습하고 이에 대한 설명을 만들어 주면 박물관, 전시관, 미술관 등에서 사용 3) 그림 동화 읽기 등 교육 목적으로 활용 가능 데이터 구축년도/
데이터 구축량2022년/300만 이미지, 300만 라벨링 -
□ 데이터 구축 규모
ㅇ 원시 및 원천 데이터: 영상 1,225건 / 이미지 3,436,368장 수집
ㅇ 가공 및 검수 데이터: 한글 및 영문 문장 6,000만 건(300만 라벨링데이터*20개 문장)□ 데이터 분포
ㅇ 원시 데이터
Super Category별 수집 구분□ 데이터 분포ㅇ 원시 데이터 Super Category별 수집 구분 Super Category별 수집 구분 Category 카테고리 목표수량 달성수량 퍼센트(%) person 사람 600,000 669,464 111.60% vehicle 탈것 105,000 118,749 113.10% outdoor 실외 85,000 97,983 115.30% animal 동물 45,000 50,175 111.50% accessory 액세서리 80,000 92,448 115.60% sports 스포츠 330,000 401,180 121.60% kitchen 주방 455,000 513,339 112.80% fruits 과일 180,000 212,589 118.10% vegetable 채소 325,000 364,024 112.00% food(western) 음식(서양) 90,000 108,846 120.90% food(eastern) 음식(동양) 110,000 139,833 127.10% furniture 가구 140,000 155,057 110.80% toilet 화장실 30,000 33,913 113.00% indoor 실내 65,000 71,754 110.40% electronic 전자기기 170,000 194,795 114.60% musical instrument 악기 150,000 164,800 109.90% medical equipment 의료기기 40,000 47,419 118.50%
Instance별 수집 구분
□ 데이터 분포ㅇ 원시 데이터 Instance별 수집 구분 Instance별 수집 구분 인스턴스 카테고리 목표수량 달성수량 001.person(person) 사람 600,000 669,464 002.bicycle(bicycle) 탈것 10,000 11,104 003.car(sedan) 탈것 5,000 6,109 004.car(suv) 탈것 5,000 6,203 005.car(pickup) 탈것 5,000 5,655 006.car(police_car) 탈것 5,000 6,431 007.car(ambulance) 탈것 20,000 21,395 008.motorcycle(motorcycle(normal)) 탈것 10,000 11,712 009.motorcycle(motorcycle(delivery)) 탈것 10,000 11,184 010.scooter(scooter) 탈것 20,000 21,261 011.bus(bus) 탈것 10,000 11,661 012.truck(truck) 탈것 5,000 6,034 013.traffic_light(traffic_light) 실외 10,000 11,190 014.fire_hydrant(fire_hydrant(outside)) 실외 5,000 6,261 015.fire_extinguisher(fire_extinguisher) 실외 10,000 11,089 016.sign(warning_sign) 실외 5,000 6,207 017.sign(direction_sign) 실외 5,000 6,111 018.sign(restriction_sign) 실외 5,000 7,054 019.trash_bin(trash_bin) 실외 20,000 21,224 020.bench(bench) 실외 5,000 7,377 021.roof(hanok_roof) 실외 20,000 21,470 022.bird(bird) 동물 10,000 11,138 023.cat(cat) 동물 10,000 11,255 024.dog(dog) 동물 5,000 6,712 025.chicken(chicken) 동물 20,000 21,070 026.backpack(backpack) 액세서리 5,000 6,431 027.umbrella(umbrella) 액세서리 10,000 11,219 028.handbag(handbag) 액세서리 5,000 6,056 029.tie(tie) 액세서리 10,000 11,100 030.suitcase(suitcase) 액세서리 10,000 11,592 031.muffler(muffler) 액세서리 20,000 24,863 032.hat(hat) 액세서리 20,000 21,187 033.ball(football) 스포츠 5,000 6,092 034.ball(golfball) 스포츠 5,000 6,760 035.ball(baseball) 스포츠 5,000 6,135 036.ball(tennisball) 스포츠 5,000 6,215 037.ball(basketball) 스포츠 5,000 6,144 038.ball(pilates_ball) 스포츠 5,000 6,025 039.ball(billiards_ball) 스포츠 5,000 7,256 040.poles(poles) 스포츠 20,000 56 041.plate(skis) 스포츠 20,000 37 042.board(board) 스포츠 5,000 28 043.drone(drone) 스포츠 10,000 12,222 044.pilates_equipment(foam_roller) 스포츠 20,000 22,525 045.pilates_equipment(band) 스포츠 10,000 11,836 046.treadmill(treadmill) 스포츠 20,000 28,640 047.dumbbell(dumbbell) 스포츠 20,000 21,780 048.golf_club(golf_club) 스포츠 20,000 23,735 049.billiards_cue(billiards_cue) 스포츠 20,000 21,890 050.skating_shoes(skating_shoes) 스포츠 20,000 20,985 051.tennis_racket(tennis_racket) 스포츠 10,000 11,149 052.badminton_racket(badminton_racket) 스포츠 20,000 21,699 053.goalpost(goalpost) 스포츠 20,000 23,601 054.basketball_hoop(basketball_hoop) 스포츠 20,000 24,182 055.carabiner(carabiner) 스포츠 20,000 21,992 056.table_tennis_racket(table_tennis_racket) 스포츠 20,000 39,974 057.rice_cooker(steamer_rice_cooker) 주방 5,000 5,909 058.rice_cooker(electric_rice_cooker) 주방 20,000 21,277 059.gas_stove(gas_stove) 주방 20,000 21,108 060.pot(pot) 주방 20,000 20,798 061.pan(pan) 주방 20,000 24,072 062.microwave(microwave) 주방 5,000 6,136 063.toaster(toaster) 주방 5,000 8,448 064.knives(knives) 주방 20,000 21,036 065.chopping_boards(chopping_boards) 주방 20,000 20,943 066.ladle(ladle) 주방 20,000 23,997 067.silicon_spatula(silicon_spatula) 주방 20,000 21,927 068.rice_spatula(rice_spatula) 주방 20,000 21,648 069.vegetable_peeler(vegetable_peeler) 주방 20,000 21,021 070.box_grater(box_grater) 주방 5,000 6,248 071.scissors(scissors) 주방 20,000 21,683 072.bowl(bowl) 주방 5,000 6,189 073.bowl(mixing_bowl) 주방 5,000 6,014 074.bowl(earthenware_bowl) 주방 5,000 6,050 075.bowl(jar) 주방 5,000 6,086 076.bowl(colander) 주방 5,000 6,082 077.cutlery(spoon) 주방 5,000 5,209 078.cutlery(chopsticks) 주방 20,000 21,496 079.cutlery(knife) 주방 5,000 6,406 080.cutlery(fork) 주방 5,000 6,565 081.plate(plate) 주방 20,000 21,062 082.side_dish(side_dish) 주방 20,000 21,086 083.tray(tray) 주방 20,000 22,605 084.mug(mug) 주방 20,000 21,476 085.refrigerator(refrigerator(normal)) 주방 5,000 5,994 086.refrigerator(gimchi_refrigerator) 주방 10,000 555 087.dish_washer(dish_washer) 주방 20,000 3,142 088.espresso_machine(espresso_machine) 주방 20,000 21,113 089.purifier(purifier) 주방 20,000 21,344 090.banana(banana) 과일 20,000 21,156 091.apple(apple) 과일 5,000 6,060 092.grape(grape) 과일 20,000 22,770 093.pear(pear) 과일 20,000 23,135 094.melon(melon) 과일 20,000 21,154 095.cucumber(cucumber) 과일 20,000 22,406 096.watermelon(watermelon) 과일 20,000 21,134 097.orange(orange) 과일 5,000 6,064 098.orange(tangerine) 과일 5,000 6,121 099.orange(hallabong) 과일 10,000 267 100.peach(peach) 과일 5,000 6,395 101.strawberry(strawberry) 과일 5,000 305 102.plum(plum) 과일 20,000 22,176 103.persimmon(persimmon) 과일 5,000 6,305 104.lettuce(lettuce) 채소 20,000 21,201 105.cabbage(cabbage) 채소 20,000 21,348 106.radish(radish) 채소 20,000 23,727 107.perilla_leaf(perilla_leaf) 채소 20,000 22,612 108.garlic(galic(normal)) 채소 10,000 11,578 109.garlic(galic(opened)) 채소 10,000 11,086 110.onion(onion) 채소 20,000 21,426 111.spring_onion(spring_onion) 채소 20,000 22,685 112.carrot(carrot) 채소 5,000 6,057 113.corn(corn) 채소 20,000 23,111 114.potato(potato) 채소 20,000 21,506 115.sweet_potato(sweet_potato) 채소 20,000 21,137 116.egg_plant(egg_plant) 채소 20,000 21,931 117.tomato(tomato) 채소 20,000 21,981 118.pumpkin(pumpkin) 채소 20,000 23,154 119.squash(squash) 채소 20,000 21,969 120.chili(chili) 채소 20,000 21,413 121.pimento(pimento) 채소 10,000 12,696 122.pimento(paprika) 채소 10,000 13,406 123.sandwich(sandwich) 음식(서양) 10,000 11,709 124.hamburger(hamburger) 음식(서양) 10,000 11,897 125.hotdog(hotdog) 음식(서양) 5,000 6,014 126.pizza(pizza) 음식(서양) 10,000 11,931 127.donut(donut) 음식(서양) 5,000 6,165 128.cake(cake) 음식(서양) 10,000 13,320 129.cake(pancake) 음식(서양) 10,000 12,598 130.cake(cupcake) 음식(서양) 10,000 12,957 131.white_bread(white_bread) 음식(서양) 10,000 11,186 132.icecream(icecream) 음식(서양) 10,000 11,069 133.ttoke(garaettoke) 음식(동양) 10,000 11,129 134.ttoke(songpyun) 음식(동양) 10,000 11,377 135.tteokbokki(tteokbokki) 음식(동양) 10,000 13,556 136.kimchi(kimchi) 음식(동양) 10,000 12,340 137.kimchi(kimchi(bachelor)) 음식(동양) 5,000 6,073 138.kimchi(kimchi(radish)) 음식(동양) 5,000 7,872 139.gimbap(gimbap) 음식(동양) 10,000 11,077 140.gimbap(triangle_gimbap) 음식(동양) 10,000 12,728 141.sushi(sushi) 음식(동양) 10,000 18,587 142.sushi(tofu_sushi) 음식(동양) 10,000 12,232 143.mandu(mandu) 음식(동양) 10,000 11,776 144.gonggibap(gonggibap) 음식(동양) 10,000 11,086 145.couch(couch) 가구 5,000 5,921 146.mirror(mirror) 가구 20,000 22,750 147.window(window) 가구 20,000 21,029 148.table(table) 가구 30,000 33,227 149.table(desk) 가구 10,000 12,764 150.lamp(lamp) 가구 20,000 21,660 151.door(door) 가구 20,000 20,932 152.chair(chair) 가구 5,000 6,138 153.bed(bed) 가구 10,000 10,636 154.toilet_bowl(toilet_bowl) 화장실 10,000 12,621 155.washstand(washstand) 화장실 20,000 21,292 156.book(book) 실내 5,000 5,515 157.clock(clock(table)) 실내 5,000 6,059 158.clock(clock(wall)) 실내 5,000 5,981 159.doll(doll) 실내 20,000 21,160 160.hair_drier(hair_drier) 실내 5,000 6,214 161.toothbrush(toothbrush) 실내 5,000 5,741 162.hair_brush(hair_brush) 실내 20,000 21,084 163.tv(tv) 전자기기 5,000 6,237 164.laptop(laptop) 전자기기 10,000 11,003 165.mouse(mouse) 전자기기 5,000 6,136 166.keyboard(keyboard) 전자기기 10,000 11,388 167.cell_phone(cell_phone) 전자기기 40,000 40,970 168.watch(watch(normal)) 전자기기 10,000 11,063 169.watch(smartwatch) 전자기기 10,000 11,182 170.camera(camera) 전자기기 20,000 26,142 171.speaker(speaker) 전자기기 20,000 21,303 172.fan(fan(stand)) 전자기기 5,000 6,139 173.fan(fan(wall)) 전자기기 5,000 6,084 174.fan(fan(fanless)) 전자기기 5,000 8,168 175.fan(fan(handy)) 전자기기 5,000 6,216 176.air_conditioner(air_conditioner(stand)) 전자기기 10,000 11,001 177.air_conditioner(air_conditioner(ceiling)) 전자기기 10,000 11,763 178.piano(piano) 악기 20,000 21,320 179.tambourine(tambourine) 악기 5,000 6,066 180.castanets(castanets) 악기 5,000 6,101 181.guitar(guitar) 악기 20,000 21,020 182.violin(violin) 악기 20,000 20,994 183.flute(flute) 악기 20,000 21,499 184.recorder(recorder) 악기 20,000 23,615 185.xylophone(xylophone) 악기 20,000 21,920 186.ocarina(ocarina) 악기 20,000 22,265 187.thermometer(thermometer) 의료기기 20,000 22,045 188.sphygmomanometer(sphygmomanometer) 의료기기 5,000 6,161 189.blood_glucose_meter(blood_glucose_meter) 의료기기 5,000 6,657 190.defibrillator(defibrillator) 의료기기 5,000 6,524 191.massage_gun(massage_gun) 의료기기 5,000 6,032 040.shuttlecock(shuttlecock) 스포츠 20,000 21,381 041.hulahoop(hulahoop) 스포츠 20,000 22,618 042.gripper(gripper) 스포츠 5,000 6,223 086.whisk(whisk) 주방 10,000 12,097 087.tongs(tongs) 주방 20,000 26,517 099.jujube(jujube) 과일 10,000 16,819 101.chestnuts(chestnuts) 과일 5,000 10,322 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드□ 활용 모델
ㅇ 개발 방법: CNN-LSTM 모델과 CNN-Transformer 모델을 동시에 개발
ㅇ 학습 성능 및 효율이 좋은 CNN-Transformer 모델의 채택
ㅇ CNN-LSTM 기반 Image captioning
- CNN으로 분류된 이미지 Feature map을 추출하고, 언어모델인 LSTM encoder-decoder 개념에 추가로 visual attention이라는 개념을 Image caption generator 모델 구현
-visual attention을 “hard” attention과 “soft” attention, 두 가지 attention mechanism으로 분류됨“soft” attention deterministic mechanism으로, standardback-propagation 방법으로 train할 수 있기 때문에 전체 모델이 end-to-end로 learning “hard” attention stochastic mechanism이며, reinforcement learning으로 training(Hard attention model은 매 iteration마다 데이터를 sampling을 해야 하고, reinforcement learning과 neural network 부분이 분리되어있어 end-to-end learning이 아님 ㅇ CNN-Transformer 기반 Image captioning
- CNN-LSTM 기반 아키텍처는 이미지 캡션에서 중요한 역할을 했지만, 훈련 효율성과 표현 능력에 한계가 존재함
- 이에 대한 대안으로 CNN-Transformer 기반 모델에 대한 연구가 시작됨
- Pedersoli et al은 image-specific attention을 생성하기 위해 weakly-supervised 방식으로 region proposal을 regress하는 spatial transformer를 제시
ㅇ CNN-Transformer model ArchitectureCNN Image Feature 추출
(pre-trained EfficientNet80 on imagenet 사용)Transformer Encoder CNN을 통해 추출된 Image Feature 입력값에 대해 새로운 representation 생성 Transformer Decoder 인코더의 출력값과 텍스트 데이터 시퀀스를 입력으로 Image caption 생성에 대한 학습을 시도 □ 활용 서비스 분야
ㅇ 방송, Youyube 등 멀티미디어 데이터가 방대해짐에 따라 특정 장면을 찾는데 많은 시간이 소요
ㅇ 이미지로부터 설명문 생성의 정확도가 높아질수록 내용 기반의 인덱싱 및 검색이 가능해짐
ㅇ Image Captioning은 Computer Vision과 Natural Language Processing 기술의 융합으로 가능한 기술이므로 아래와 같이 활용 가능함
- 시각 장애우들에게 화면을 설명해줄 수 있는 문장 생성
- 여러 그림 작품을 학습하고 이에 대한 설명을 만들어 주면 박물관, 전시관, 미술관 등에서 사용
- 그림 동화 읽기 등 교육 목적으로 활용 가능 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드□ 어노테이션 포맷
□ 어노테이션 포맷 구분 항목 필수 비고 항목명 타입 설명 여부 1 info Object 데이터셋 정보 ᅠ 1-1 info.description String 데이터셋 명칭 Y 1-2 info.version String 데이터셋 버전 Y 1 1-3 info.year String 데이터셋생성년도 Y 2022 2 Categories Arr[Obj] 카테고리 정보 ᅠ 2-1 Categories[].supercategory String 카테고리 대분류 Y 17개 super category (class) 2-2 Categories[].id String 카테고리 아이디 Y 150개 main Categories (object) ID ᅠ 2-3 Categories[].name String 카테고리 소분류 Y 150개 main Categories (object)이름 3 images Arr[Obj] 이미지 정보 ᅠ 3-1 images[].id String 이미지 식별자 Y 3-2 images[].width Number 이미지 너비 Y 3-3 images[].height Number 이미지 높이 Y ᅠ 3-4 images[].file_name String 이미지파일명 Y ᅠ5 annotations Object 어노테이션 정보 ᅠ 5-1 annotations[].Korean String 한글설명문텍스트 Y ᅠ 5-2 annotations[].English String 영어설명문텍스트 Y □ 라벨링 데이터 실제 예시
-
데이터셋 구축 담당자
수행기관(주관) : ㈜메트릭스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박두진 02-6244-0791 [email protected] 과제 총괄 책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜더바이럴 수집/정제 ㈜메트릭스 가공 ㈜아비스 검수 ㈜어반유니온 모델링 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박두진 02-6244-0791 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.