-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-09-27 저작도구 소스코드 등록 2022-10-20 신규 샘플데이터 개방 2022-07-13 콘텐츠 최초 등록 소개
버섯 5종(느타리, 큰느타리, 팽이, 표고, 양송이)의 배양, 생육, 병해 데이터를 수집하고 분석하여 자동화·지능화 농업 및 버섯 연구에 다양한 형태로 활용할 수 있는 학습 데이터셋
구축목적
버섯 데이터셋은 데이터 수집, 분석, 이용, 공유 전 과정을 원스톱 형태로 지원할 수 있는 장기적인 데이터 생태계 구축의 초~중반 과정을 지원하는 데이터로 활용할 수 있다. 또한 데이터가 전무한 버섯의 종류별 생육데이터를 확보하고 이를 활용하여 버섯 농가의 생육 환경을 개선할 수 있다.
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 5개 농가 및 국립원예특작과학원 스마트배양실 4실 활용 라벨링 유형 바운딩박스(이미지), 세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 1. 스마트팜에서 재배되는 버섯 품종 인식과 버섯의 수확기 판단, 병해 판단 가능 - 소비자 수요 속성 맞춤형 작물 생산 2. 이미지데이터, 사물인터넷(IoT), 인공지능(AI) 등 실시간으로 생성‧축적되는 빅데이터를 활용한 정밀농업으로 버섯산업이 충분히 성장 가능할 것으로 예상 - 대규모 플랫폼 구축 3. 각 버섯별, 실증농가별, 생산품질별로 다양하게 수집된 데이터를 중심으로 공통구조에 기반한 데이터 연계를 추진, 중소생산농가 통합형 또는 대기업과의 상생형 플랫폼 등을 구축하여 작물의 특화성이 보다 다양해질 것으로 예상 데이터 구축년도/
데이터 구축량2021년/350,621건 -
1. 데이터 구축 규모
- 원천데이터 350,621건
양송이 70,900 / 느타리 86,460 / 큰느타리 62,419 / 팽이 77,050 / 표고 53,792
2. 데이터 분포
- 원천데이터 350,621건
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 활용 모델
1.1 모델학습- 버섯 품종인식, 버섯 생육단계 판단, 버섯 병충해 판단 모델을 개발하였으며,
- 데이터는 학습(80%)/검증(10%)/평가(10%)로 구분하여 관리함
- 학습을 통하여 생성된 객체 탐지 알고리즘의 객관적/주관적 성능평가 진행함
- 객관적 성능평가: mAP@50, accuracy 성능 산출
- 주관적 성능평가: 탐지된 객체를 사진파일로 시각화 하여 육안으로 확인
1.2 서비스 활용 시나리오
- 버섯의 상태에 따른 환경정보 제시 및 가이드 제공 서비스
- 학습 데이터를 적용한 학습 모델 구축
- 스마트폰, AR 글라스 등 각종 기기와 접목한 시스템 개발
2. 기타 정보
- 대표성
느타리, 큰느타리, 팽이, 표고, 양송이버섯 총 5품종의 전체 생육주기와 환경요소에 따른 영상을 통해 이미지 데이터를 확보하여 학습 데이터로 가공 - 독립성
데이터가 전무한 버섯의 종류별 생육데이터를 구축하였으며, 버섯의 생육단계별 이미지 데이터, 생육 환경 데이터, 병해충 데이터 등을 체계적으로 수집
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 바운딩박스 객체 인식 Object Detection YOLO v4, YOLO v3-tiny mAP 80 % 98.2 % 2 폴리곤 객체 인식 Object Detection Mask R-CNN mIoU 70 % 82.44 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 대표도면
1.1 Bounding Box- Bounding Box는 버섯, 배지, 병목을 포함하는 것을 기준으로 각 버섯의 특성에 따라 각기 다른 상세 기준 설정
1.2 Polygon Segmentation
- Segmentation은 버섯의 외곽선을 따라 라벨링을 하는 것을 기준으로 상세 작업 기준 설정
2. JSON 형식
3. 라벨링데이터 구성
3. 라벨링데이터 구성 분류 구분 항목명 설명 범위 타입 필수여부 비고 파일정보 1–1 DATASET_NAME 데이터셋명 1000 String Y 1–2 DATASET_DETAIL 데이터셋상세설명 1000 String N 1–3 VERSION 버전 3 String N 1–4 LICENSE 라이선스 100 String N 1–5 CREATE_DATE_TIME 파일 생성 일자 20 String Y 1–6 CONTRIBUTOR 기여자 200 String N 1–7 URL URL 200 String N 1–8 CATEGORY_NAME 카테고리 명 20 String Y 이미지 파일 정보 2–1 IMAGE_URL 이미지 URL 100 String Y 2–2 IMAGE_FILE_NAME 이미지 파일명 10 String Y 2–3 WIDTH 이미지 가로 1072~1080 NUMBER Y 2–4 HEIGHT 이미지 세로 1920 NUMBER Y 2–5 ANNOTATION_COUNT 이미지당 라벨 개수 0~100 NUMBER Y 어노테이션 정보 3–1 ID 어노테이션 식별자 0~4294967295 NUMBER Y 3–2 BOUNDING_BOX_X_COORDINATE 바운딩박스 X좌표 0~4294967295 NUMBER N 3–3 BOUNDING_BOX_Y_COORDINATE 바운딩박스 Y좌표 0~4294967295 NUMBER N 3–4 BOUNDING_BOX_WIDTH 바운딩박스 가로 0~4294967295 NUMBER N 3–5 BOUNDING_BOX _HEIGHT 바운딩박스 높이 0~4294967295 NUMBER N 3–6 SEGMENTATION 세그멘테이션 array N NUMBER ARRAY 세그멘테이션영역합 0~4294967295 NUMBER N SEGMENTATION_AREA_TOTAL 3–7 크라우드소싱 작업여부 Boolean N CROWDSOURSING_OPERATION_ALTERNATIVE 3–8 메타 4–1 DBYHS_SPCHCKN 병해충구분 10 String N -세균갈색무늬병 -세균성검은썩음병 -흰곰팡이 -솜털곰팡이 -푸른곰팡이 4–2 DBYHS_NORMALITY_ALTERNATIVE 정상여부 Boolean N 4–3 IP_CAMERA_ID IP카메라 아이디 0~100 NUMBER N 4–4 WIND_SPEED 풍속 0~5 NUMBER N 4–5 AIR_VELOCITY 풍속 0~5 NUMBER N 4–6 TEMPERATURE 온도 0~100 NUMBER N 4–7 HUMIDITY 습도 0~100 NUMBER N 4–8 ILLUMINATION_INTENSITY 조도 -60~100 NUMBER N 4–9 CARBON_DIOXIDE 이산화탄소(CO2) -20~7600 NUMBER N 4–10 GUIDELINE 가이드라인 array N NUMBER ARRAY 4–11 IMAGE_CREATE_DATE 이미지 생성 날짜 YYYY-MM-DD String N 4–12 IMAGE_CREATE_TIME 이미지 생성 시간 HH:mm:ss String N 4–13 IMAGE_CREATE_DAY_OF_WEEK 이미지 생성 요일 20 String N 4–14 STIPE_LENGTH 대길이 0 NUMBER N 4–15 STIPE_THICKNESS 대두께 0 NUMBER N 4–16 PILEUS_DIAMETER 갓직경 0 NUMBER N 4–17 PILEUS_THICKNESS 갓두께 0 NUMBER N 4–18 GROSS_WEIGHT 총중량 0 NUMBER N - Bounding Box는 버섯, 배지, 병목을 포함하는 것을 기준으로 각 버섯의 특성에 따라 각기 다른 상세 기준 설정
-
데이터셋 구축 담당자
수행기관(주관) : ㈜유클리드소프트
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 황준원 070-5151-5581 [email protected] · 수집, 정제, 가공 · 품질검증 · 경진대회 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜엠에이치소프트 · 수집, 정제, 모델링 전북대학교 산학협력단 · 데이터셋 설계
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.