-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 표준 전문 사육시설(곤충잠업연구소)에서 수집한 식용곤충 6종에 대한 RGB 이미지, 분광 이미지, 환경 데이터 수집/가공/AI모델링을 통하여 구축한 데이터
구축목적
- 미래 고부가가치 산업인 식용곤충의 다양한 산업적 활용 시장 확대와 식용곤충 사육농가의 애로기술 해결을 위하여 인공지능 학습 이미지 데이터와 관련 환경 데이터를 수집·정제·모델링하여 구축함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg, png, csv 데이터 출처 자체 수집 라벨링 유형 바운딩박스(이미지), 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 곤충사육 모니터링 서비스, 곤충 대량생산 시스템 등에 활용 가능 데이터 구축년도/
데이터 구축량2023년/총 이미지 RGB 20만장/분광 20만장 이상, 환경데이터 20만세트 이상 -
- 데이터 통계
• 전체 이미지 및 라벨링 데이터 수량데이터 통계 - 전체 이미지 및 라벨링 데이터 수량 구 분 데이터 건수 이미지
합계RGB
이미지분광
이미지이미지
데이터장수풍뎅이 유충 68,000건 34,000건 34,000건 흰점박이 꽃무지 유충 68,000건 34,000건 34,000건 갈색거저리 유충 68,000건 34,000건 34,000건 백강잠 유충 68,000건 34,000건 34,000건 메뚜기 약충, 성충 68,000건 34,000건 34,000건 풀무치 약충, 성충 68,000건 34,000건 34,000건 • 데이터셋 원천 데이터 및 라벨 데이터 수량(객체별, 어노테이션 별)
- 식용곤충 RGB 이미지 데이터데이터 통계 전체 - 데이터셋 원천 데이터 및 라벨 데이터 수량(객체별, 어노테이션 별) - 식용곤충 RGB 이미지 데이터 데이터 종류 원천데이터(장)
(RGB 이미지)라벨링 수량 바운딩박스 폴리곤 장수풍뎅이 유충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 흰점박이 꽃무지 유충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 갈색거저리 유충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 백강잠 유충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 메뚜기 약충, 성충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 풀무치 약충, 성충 정상 17,000 15,300 1,700 비정상 17,000 15,300 1,700 합 계 204,000 183,600 20,400 - 식용곤충 분광 이미지 데이터
데이터 통계 전체 - 데이터셋 원천 데이터 및 라벨 데이터 수량(객체별, 어노테이션 별) - 식용곤충 분광 이미지 데이터 종류 원천데이터(장)
(분광 이미지)라벨링 수량 바운딩박스 장수풍뎅이 유충 정상 17,000 17,000 비정상 17,000 17,000 흰점박이 꽃무지 유충 정상 17,000 17,000 비정상 17,000 17,000 갈색거저리 유충 정상 17,000 17,000 비정상 17,000 17,000 백강잠 유충 정상 17,000 17,000 비정상 17,000 17,000 메뚜기 약충, 성충 정상 17,000 17,000 비정상 17,000 17,000 풀무치 약충, 성충 정상 17,000 17,000 비정상 17,000 17,000 합 계 204,000 204,000 • 데이터 분포
데이터 통계 - 데이터 분포 항목 조건 구분 수량 비율 RGB 이미지 장수풍뎅이 유충 정상 17,000 8.33% 비정상 17,000 8.33% 흰점박이 꽃무지 유충 정상 17,000 8.33% 비정상 17,000 8.33% 갈색거저리 유충 정상 17,000 8.33% 비정상 17,000 8.33% 백강잠 유충 정상 17,000 8.33% 비정상 17,000 8.33% 메뚜기 약충, 성충 정상 17,000 8.33% 비정상 17,000 8.33% 풀무치 약충, 성충 정상 17,000 8.33% 비정상 17,000 8.33% 소계 204,000 100% 분광 이미지 장수풍뎅이 유충 정상 17,000 8.33% 비정상 17,000 8.33% 흰점박이 꽃무지 유충 정상 17,000 8.33% 비정상 17,000 8.33% 갈색거저리 유충 정상 17,000 8.33% 비정상 17,000 8.33% 백강잠 유충 정상 17,000 8.33% 비정상 17,000 8.33% 메뚜기 약충, 성충 정상 17,000 8.33% 비정상 17,000 8.33% 풀무치 약충, 성충 정상 17,000 8.33% 비정상 17,000 8.33% 소계 204,000 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
1. 모델 학습
⚬ 모델명 : Yolov8 (bbox)
⚬ 항목명 : 객체 탐지
⚬ 활용 AI 모델 설명
- 식용곤충 이미지에 대하여 객체의 종류와 정상여부를 탐지하도록 함
- Yolov8은 2023년 8월 기준 Yolo 모델 중 가장 최신 버전이며, mAP가 높은 모델임
- 기존의 Yolov5과 달리 여러 개의 바운딩박스를 생성하지 않고, 물체의 중심을 한 번에 예측하도록 변경되어 학습 속도가 더욱 빨라짐
< Yolov8 모델 구조도 >
⚬ 모델명 : Mask R-CNN (polygon)
⚬ 항목명 : 객체 분할
⚬ 활용 AI 모델 설명
- 식용곤충 이미지에 대하여 객체의 위치와 종류를 탐지하도록 함
- Mask R-CNN은 Object Detection과 Sementic Segmentation의 장점을 합친 모델로 객체의 윤곽에 대해 픽셀 단위로 정보를 처리할 수 있는 모델임
- Mask R-CNN은 R-CNN에서 Mask 결과 (객체별 윤곽 탐지 결과)와 RoI (Region of Interest) 특징을 입력하는 MaskIoU 헤드가 추가된 모델임
- resnet-50, resnet-101 등 다양한 모델을 backbone으로 활용할 수 있음< Mask R-CNN 모델 구조도 >
⚬ 모델명 : TabNet
⚬ 항목명 : 예측
⚬ 활용 AI 모델 설명
- 식용곤충의 생장 정보 데이터를 통하여 객체의 길이와 무게를 예측하도록 함
- TabNet은 별도의 전처리 없이 데이터 학습이 가능하며, DT와 DNN을 결합한 형태로 예측 및 분류 성능이 높은 모델임
- 학습 과정에서 사용된 변수들의 예측 및 분류 결과에 끼치는 영향도를 파악할 수 있음< TabNet 모델 구조도 >
2. 서비스 활용 시나리오
⚬ 곤충사육 모니터링 프로그램과 환경 자동제어 시스템에 활용할 수 있음
⚬ 스마트팜의 공조설비와 연결하여 곤충 대량생산시스템 관리에 활용 가능
⚬ 곤충 가공기업 식용곤충 활용 시 제품 문제시 요구되는 추적 이력제에 활용될 수 있음
⚬ 식용곤충의 다양한 산업적 활용 시장 확대(식용, 사료, 의약, 화장품)에 기여 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
• 원천 데이터데이터 구성 - 원천 데이터 < RGB 이미지 예시 > < 분광 이미지 예시 > - 어노테이션 포맷
• 어노테이션 포맷 정의
- JSON 파일 내 주요 메타 정보, 식용 곤충 위치 정보, 환경, 관리 정보
- 관리데이터의 탈피정보는 유충의 경우, 령수(1령, 2령 등) 정보를 수집하고 성충의 경우, 탈피횟수(1회, 2회 등) 정보를 수집함. 종별 령수 및 탈피횟수는 전문가 의견에 따라 구분함.어노테이션 포맷 정의 구분 속성명 타입 필수여부 설명 1 info object 기본 정보 1-1 id string Y 파일아이디 1-2 filename string Y 파일명 1-3 file_folder string Y 저장폴더 1-4 resolution array Y 해상도 1-5 region_name string Y 위치정보 1-6 date string Y 시간정보 1-7 file_format string Y 파일포맷 1-8 copyright string Y 저작권정보 1-9 pixel string Y 화소 2 annotation object 어노테이션 정보 2-1 annotation_id string Y 어노테이션 아이디 2-2 image_id string Y 이미지 아이디 2-3 annotation_type string Y 어노테이션 타입 2-4 class_name string Y 클래스명 2-5 points string Y 어노테이션 포인트 2-6 object_code string Y 객체 코드 2-7 object_name string Y 객체명 2-8 object_status string Y 객체 상태 3 sensor object 사육실 및 스마트 곤충사 환경 데이터 3-1 breeding_room_indoor_temperature number Y 사육실온도(℃) 3-2 breeding_room_indoor_humidity number Y 사육실습도(%) 3-3 breeding_room_indoor_co2 number Y 사육실Co2(ppm) 3-4 insect_breeding_box_surface_temperature number Y 표층온도(℃) 3-5 insect_breeding_box_surface_humidity number Y 표층습도(%) 3-6 insect_breeding_box_surface_co2 number Y 표층Co2(ppm) 3-7 insect_breeding_box_surface_ammonia number Y 표층암모니아(ppm) 3-8 insect_breeding_box_surface_illuminance number Y 표층조도(lx) 3-9 insect_breeding_box_surface_hydrogen_sulfide number Y 표층황화수소(ppm) 3-10 insect_breeding_box_surface_methane number Y 표층메탄(ppm) 3-11 insect_breeding_box_surface_voc number Y 표층voc(TVOC) 3-12 insect_breeding_box_depth_temperature number Y 심층온도(℃) 3-13 insect_breeding_box_depth_humidity number Y 심층습도(%) 3-14 insect_breeding_box_depth_moisture_meter number Y 심층수분계(%) 4 management 관리 데이터 4-1 insect_length string Y 생장단계별 크기(길이)(1mm) 4-2 insect_average_weight string Y 무게(0.1g) 4-3 status_info string Y 상태정보 4-4 molting_info number Y 탈피정보 4-5 feed_supply_amount string Y 먹이량(1g) 4-6 feed_type string Y 사료종류 4-7 moisture_content string Y 수분 함량(%) 4-8 identifier string Y 식별자 4-9 creator string Y 데이터 생성 기관 4-10 title string Y 프로젝트 명칭 4-11 publisher string Y 데이터 배포 기관 4-12 publication_year string Y 데이터 수집 년도 - 데이터 포맷
• 라벨데이터 예시{
"info": {
"id": "R_AB_LV01_NM_20231023_0001",
"filename": "R_AB_LV01_NM_20231023_0001.jpg",
"file_folder": "/R/BOX/AB/NM",
"resolution": {
"width": 1920,
"height": 1080
},
"region_name": "전라남도농업기술원 곤충잠업연구소",
"date": "2023-11-14 04:29:07",
"file_format": "jpg",
"copyright": "SMT",
"pixel": 2073600
},
"annotation": [
{
"annotation_id": "c99ddf82-12a3-428a-a36a-04ebff7b1881",
"image_id": "R_AB_LV01_NM_20231023_0001",
"annotation_type": "BOX",
"class_name": "BOX_R_AB_NM",
"points": {
"x": 447.2943475255164,
"y": 467.2043054531158,
"width": 201.63302113472162,
"height": 200.83289314453498
},
"object_code": "AB",
"object_name": "장수풍뎅이",
"object_status": "NM"
},
{
"annotation_id": "b4da9a93-0c0f-4f22-8a45-03a7396325ad",
"image_id": "R_AB_LV01_NM_20231023_0001",
"annotation_type": "BOX",
"class_name": "BOX_R_AB_NM",
"points": {
"x": 1021.7884115672036,
"y": 561.6197544484289,
"width": 228.0373105570011,
"height": 233.63832418199695
},
"object_code": "AB",
"object_name": "장수풍뎅이",
"object_status": "NM"
}
],
"sensor": {
"breeding_room_indoor_temperature": 25.7,
"breeding_room_indoor_humidity": 65.7,
"breeding_room_indoor_co2": 1119,
"insect_breeding_box_surface_temperature": 25.9,
"insect_breeding_box_surface_humidity": 65.6,
"insect_breeding_box_surface_co2": 1153,
"insect_breeding_box_surface_ammonia": 0.8,
"insect_breeding_box_surface_illuminance": 0,
"insect_breeding_box_surface_hydrogen_sulfide": 0.7,
"insect_breeding_box_surface_methane": 11.98,
"insect_breeding_box_surface_voc": 32,
"insect_breeding_box_depth_temperature": 26.7,
"insect_breeding_box_depth_humidity": 66.5,
"insect_breeding_box_depth_moisture_meter": 55.5
},
"management": {
"insect_length": 58.8,
"insect_average_weight": 5.78,
"status_info": "냉동",
"molting_info": 1,
"feed_supply_amount": 8.0,
"feed_type": "곤충젤리",
"moisture_content": 57.3,
"identifier": "AB_LV01_NM",
"creator": "SMT",
"title": "Automation of Edible Insect Farming Data",
"publisher": "SMT",
"publication_year": 2023
}
}- 실제 예시
- 라벨링 예시실제 예시 - 라벨링 예시 < b-box > < polygon > -
데이터셋 구축 담당자
수행기관(주관) : 비에이코리아(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최원규 02-780-2672 [email protected] 사업총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜밸리언트데이터 데이터 품질관리 순천대학교 산학협력단 데이터 수집 에스엠티정보기술(주) 데이터 수집, 정제 전남농업기술원 곤충잠업연구소 데이터 수집 ㈜플렉싱크 데이터 가공 한국광기술원 데이터 수집 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 최원규 02-780-2672 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 최원규 02-780-2672 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 송재훈 064-702-7860 [email protected] 김성율 064-702-7860 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.