-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-01-10 데이터 최종 개방 1.0 2023-04-30 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-02-29 산출물 전체 공개 소개
참외 재배 시 발생하는 노균병, 흰가루병의 진단을 목적으로 노균병, 노균병유사, 흰가루병, 흰가루병유사, 정상 이미지를 인공지능 학습하여 질병과 질병의 유사 형상 및 정상 이미지를 비교해 질병의 정확한 진단을 가능하게 함
구축목적
참외 재배 시 발생하는 병해충 중 피해가 큰 노균병, 흰가루병 및 각 질병의 유사 형상 데이터를 수집하여 질병의 조기 파악 및 추후 지능형 서비스로 질병과 방제시기를 제공해 참외의 우수한 품질을 유지하고 경제적 효과를 도모함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 참외 온실 라벨링 유형 바운딩박스(이미지) 라벨링 형식 JSON 데이터 활용 서비스 병해충 탐지 웹/앱 서비스 데이터 구축년도/
데이터 구축량2022년/234,756건 -
데이터 통계
데이터 통계 대상 작물 산출 (작물의 생육특성 및 작황 현장 수집환경에 따라 변동 가능) 연번 품목 ※ 현장 수집환경 및 작물생육 상황에 따라 품종별 생육단계별 수집율 및 개체 수량 변동 가능 1 참외 개체수 대상 정식 착과 수확 소계 200 이미지 39,723 104,553 90,480 234,756 환경데이터 79,446 209,106 180,960 469,512 데이터 분포
▪생육 단계 분포
생육 단계 분포 grdp_step 건수 비율 정식 39,723 16.92% 착과 104,553 44.54% 수확 90,480 38.54% 합계 234,756 100% ▪질병 분포
질병 분포 class_name 건수 비율 노균병 48,892 20.83% 노균병유사 40,394 17.21% 정상 85,401 36.38% 흰가루병 40,176 17.11% 흰가루병유사 19,893 8.47% 합계 234,756 100% 주간/야간 day_section 건수 비율 주간 156,175 66.53% 야간 78,581 33.47% 합계 234,756 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드학습 데이터 비율
학습 데이터 비율 구분 학습(training) 검증(validation) 시험(test) 데이터 187,812 23,472 23,472 비율 80% 10% 10% resNet 학습 모델 소개
병해가 있는 잎을 초기에 검출하기 위해서는 질병 여부를 분류할 수 있는 알고리즘(classification)이 필요
분류(classification)가 가능한 알고리즘 중 resNet은 잔차 처리 방식을 도입하여 깊은 depth의 신경망 학습을 가능하게 함
기존의 VGG보다 네트워크의 깊이가 깊지만 residual block을 활용하여 복잡도와 성능을 개선하였고 구현은 간단해졌으며 학습 난이도가 낮아짐
Layer가 깊어질수록 효율적인 학습이 진행되고 정확도가 높아짐
resNet 구조 및 아키텍처
<기존 네트워크와 resNet의 구조>
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 질병 분류 성능 Image Classification resNet50 Accuracy 80 % 97.71 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드
데이터 포맷▪이미지 데이터 포맷 예시
이미지 데이터 포맷 예시 구분 원천 이미지 라벨링 이미지 이미지 해상도 4600*3600 100만 화소 이상 데이터 포맷 JPG JPG 클래스 - 노균병 ▪json 형식 예시
{
"base_info": {
"image_name": "S019-FM02-019-2022-06-25-000001.jpg",
"image_path": "DATA_SET/training/po/image",
"description": "참외 질병 2022 Dataset",
"url": "https://aihub.or.kr/",
"version": "1.0",
"create_date": "2022-06-07"
},
"corps_info": {
"frm_id": "FM01",
"frm_name": "농장01",
"frm_lctn": [35.9189993, 128.2894434],
"indvd_code": "S001",
"cltvtn_typ_cd": "단동",
"corps_name": "참외",
"vrty_name": "위풍당당",
"set_meal_dt": "2022-06-17",
"grdp_step": "정식"
},
…
}
데이터 구성
▪데이터 구성
데이터 구성 Key Description Type image_name 이미지 이름 String image_path 이미지 경로 String description 사업 설명 String url url String version 버전 String create_date 사업년도 String frm_id 농장 아이디 String frm_name 농장 이름 String frm_lctn 농장 위치 Array indvd_code 개체 코드 String cltvtn_typ_cd 시설 타입 String corps_name 작물 이름 String vrty_name 품종 이름 String set_meal_dt 정식일자 String grdp_step 생육단계 String image_wdth 이미지 너비 Number image_hght 이미지 높이 Number ext_type 확장자 타입 String potogrf_dt 이미지 촬영일 String create_dt 이미지 생성일 String creator_name 촬영자 이름 String potogrf_lctn 촬영 위치 Array potogrf_angle 촬영 각도 Number potogrf_dstnc 촬영 거리 String rsoltn 해상도 String shttr_spd 셔터스피드 String iso iso 감도 Number white_balance 화이트 밸런스 String fcs_dstnc 초점거리 Number flash_mode 플래시모드 String f_stop 광량 Number expsr_time 노출시간 Number day_section 주간/야간 정보 String class_name 분류 이름 String evrmnt_id 아이디 Number inr_tp (온실내부) 온도 센서 Number(℃) inr_hd (온실내부) 습도 센서 Number(%) CO2 (온실내부) CO2 센서 Number(ppm) amnt_of_slr_rdt (온실내부) 일사량 센서 Number(W/㎡) soil_ec (온실배지) EC 센서 Number(ms/cm) soil_tp (온실배지) 지온 센서 Number(℃) soil_hd (온실배지) 지습 센서 Number(%) rain (온실외부) 감우 센서 String extrnl_tp 외부온도 Number(℃) extrnl_hd 외부습도 Number(%) receive_dt 수신 일시 String licenses_id 아이디 Number licenses_name 이름 String licenses_url url String ▪어노테이션 포맷
어노테이션 포맷 No. 항목 길이 타입 필수 여부 비고 한글명 영문명 1 사업 정보 base_info 1-1 이미지 이름 image_name varchar Y 1-2 이미지 경로 image_path varchar Y 1-3 사업 설명 description varchar Y 1-4 URL url varchar Y 1-5 버전 version varchar Y 1-6 사업년도 create_date varchar Y 2 농장 정보 corps_info 2-1 농장 아이디 frm_id 20 varchar Y 2-2 개체 코드 indvd_code 10 varchar Y 2-3 재배 시설 유형 cltvtn_typ_cd 10 varchar Y 2-4 농장 이름 frm_name 30 varchar Y 2-5 농장 위치 frm_lctn 100 varchar Y 2-6 작물 이름 corps_name 30 varchar Y 2-7 품종 이름 vrty_name 30 varchar Y 2-8 정식 일자 set_meal_dt 20 varchar Y 2-9 생육 단계 grdp_step 20 varchar Y 3 이미지 정보 image 3-1 분류 이름 class_name 20 varchar Y 3-2 이미지 너비 image_wdth decimal Y 3-3 이미지 높이 image_hght decimal Y 3-4 확장자 타입 ext_type 10 varchar Y 3-5 이미지 촬영일 potogrf_dt 20 varchar Y 3-6 이미지 생성일 create_dt 20 varchar Y 3-7 촬영자 이름 creator_name 20 varchar 3-8 촬영 위치 potogrf_lctn 30 varchar Y 3-9 촬영 각도 potogrf_angle decimal Y 3-10 촬영 거리 potogrf_dstnc 50 varchar Y 3-11 해상도 rsoltn 20 varchar Y 3-12 셔터스피드 shttr_spd 20 varchar Y 3-13 iso 감도 iso decimal Y 3-14 화이트 밸런스 white_balance 10 varchar Y 3-15 초점거리 fcs_dstnc decimal Y 3-16 플래시모드 flash_mode 10 varchar 3-17 광량 f_stop decimal Y 3-18 노출시간 expsr_time decimal Y 3-19 주간/야간 정보 day_section 10 varchar Y 4 재배 환경 정보 environments 4-1 아이디 evrmnt_id decimal Y 4-2 수신일시 receive_dt 20 varchar Y 4-3 내부온도 inr_tp decimal Y 4-4 내부습도 inr_hd decimal Y 4-5 일사량 amnt_of_slr_rdt decimal Y 4-6 CO2 CO2 decimal Y 4-7 외부온도 extrnl_tp decimal Y 4-8 외부습도 extrnl_hd decimal Y 4-9 감우 rain 20 varchar Y 4-10 토양EC soil_ec decimal Y 4-11 지온 soil_tp decimal Y 4-12 지습 soil_hd decimal Y 5 라이선스 licenses 5-1 아이디 licenses_id varchar Y 5-2 이름 licenses_name varchar Y 5-3 URL licenses_url varchar Y ▪실제 예시
{
"base_info": {
"image_name": "S019-FM02-019-2022-06-25-000001.jpg",
"image_path": "DATA_SET/training/po/image",
"description": "참외 질병 2022 Dataset",
"url": "https://aihub.or.kr/",
"version": "1.0",
"create_date": "2022-06-07"
},
"corps_info": {
"frm_id": "FM01",
"frm_name": "농장01",
"frm_lctn": [35.9189993, 128.2894434],
"indvd_code": "S001",
"cltvtn_typ_cd": "단동",
"corps_name": "참외",
"vrty_name": "위풍당당",
"set_meal_dt": "2022-06-17",
"grdp_step": "정식"
},
"image": {
"image_wdth": 3468,
"image_hght": 4624,
"ext_type": "jpg",
"potogrf_dt": "2022-06-25 12:00:00",
"create_dt": "2022-06-31 16:30:00",
"creator_name": "춘종묘",
"potogrf_lctn": [20, 60],
"potogrf_angle": 90,
"potogrf_dstnc": "50cm",
"rsoltn": "1024 x 1024",
"shttr_spd": "1 sec",
"iso": 96,
"white_balance": "AUTO",
"fcs_dstnc": 4.6,
"flash_mode": "OFF",
"f_stop": 1.8,
"expsr_time": 100,
"day_section": "주간",
"class_name": "흰가루"
},
"envrionments": [
{
"evrmnt_id": 0,
"inr_tp": 45.0,
"inr_hd": 37.6,
"amnt_of_slr_rdt": 463,
"CO2": 503,
"soil_ec": 0.24,
"soil_tp": 34.4,
"soil_hd"17.1,
"extrnl_tp": 32.0,
"extrnl_hd": 65,
"rain": "맑음",
"receive_dt": "2022-06-25 11:00:00",
},
{
"evrmnt_id": 1,
"inr_tp": 45.0,
"inr_hd": 37.6,
"amnt_of_slr_rdt": 463,
"CO2": 503,
"soil_ec": 0.24,
"soil_tp": 34.4,
"soil_hd"17.1,
"extrnl_tp": 32.0,
"extrnl_hd": 65,
"rain": "맑음",
"receive_dt": "2022-06-25 11:30:00",
},
],
"licenses": [
{
"licenses_id": 0,
"licenses_name": "UBN Consortium",
"licenses_url": ""
}
] -
데이터셋 구축 담당자
수행기관(주관) : ㈜유비엔
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 변기식 053-623-6001 [email protected] 데이터 구축 및 모델 학습 수행기관(참여)
수행기관(참여) 기관명 담당업무 성주참외과채류연구소 농업 자문 및 데이터 확보 춘종묘 참외 질병 진단 및 데이터 확보 경상대학교 데이터셋 구축 및 학습 모델 자문 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 변기식 053-623-6001 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.