-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-01 데이터 최종 개방 1.0 2023-07-25 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
벼 경작지에서 드론을 통해 취득된 다분광 이미지 상에서 벼의 생육이상 영역을 탐지하기 위한 학습용 데이터
구축목적
벼의 생육 시기별 정상과 생육이상 4종(도복, 결주, 도열병, 생육부진)을 구별하기 위한 인공지능 학습용 데이터를 구축함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 tif. 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 json 데이터 활용 서비스 벼 생육이상 탐지 및 분류 모델 데이터 구축년도/
데이터 구축량2022년/이미지 데이터 200,910장, 라벨링 데이터 200,910장 -
1. 학습용 데이터 구축 규모
1. 학습용 데이터 구축 규모 구분 성과목표 구축실적 달성율 데이터셋 다중분광 촬영 이미지 데이터 200,000장 200,910장 100.40% 벼 단위 수량 데이터 400건 400건 100% 학습모델
(SegFormer)정상 vs 도복 mAcc 90% 90.46% 101% 정상 vs 생육부진 mAcc 80% 81.21% 102% 정상 vs 도열병 mAcc 80% 87.23% 109% 정상 vs 결주 mAcc 80% 82.92% 104% 전체 mAcc 70% 77.44% 111% 2. 데이터 분포
2. 데이터 분포 클래스 분포 클래스 분포 수량 비율 데이터셋 정상 1 1,132,040 57.60% 도열병 2 50,625 2.60% 도복 3 51,565 2.60% 결주 4 630,905 32.10% 생육부진 5 99,590 5.10% 총 구축 규모 1,964,725 100% 2. 데이터 분포 날씨 분포 날씨 분포 수량 비율 데이터셋 맑음 71,955 35.80% 구름조금 95,285 47.40% 흐림 33,385 16.60% 약간흐림 285 0.10% 총 구축 규모 200,910 100% 2. 데이터 분포 시간 분포 시간 분포 수량 비율 데이터셋 9시 425 0.20% 10시 58,860 29.30% 11시 32,760 16.30% 12시 43,610 21.70% 13시 43,750 21.80% 14시 21,505 10.70% 총 구축 규모 200,910 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드□ 활용 모델
- (메인모델) SegFoemer
Encoder를 계층적으로 구성해 multiscale feature output 구성
복잡한 Decoder가 아니라 MLP만 사용해 가벼운 Decoder 사용
ViT의 single scale resolution feature map만 뽑는 것에 반해 SegFormer 모델은 CNN처럼 multi-level feature map을 추출
Overlapped Patch Merging 방법으로 non-overlapping patch merging 방법의 주변의 local continuity를 보존하지 못하는 문제 해결
연산량을 줄이기 위해 K, V의 사이즈 줄여 Self-Attention 연산(후보모델) K-Net
모델의 백본을 CNN, transformer 둘 모두 사용할 수 있고, ResNet-50과 Swin transformer를 backbone으로 사용한다는 특징이 있음.
(해당 모델은 후보모델으로, 학습된 체크포인트 파일은 제공하지 않음)
- (후보모델) Segmenter
ViT를 기반으로 기존 분류 모델로 작동하던 모델을 segmentation 모델로 작동하도록 하는 특징이 있음.
(해당 모델은 후보모델으로, 학습된 체크포인트 파일은 제공하지 않음)
* 소스 파일 내 SegFormer, K-Net, Segmenter 세 가지 모델 모두 탑재되어 있음□ 모델 학습
벼 생육 이상 Semantic Segmentation 모델 학습
(학습 목표) 벼의 생육 과정에서 일어나는 생육 이상을 Semantic Segmentation
(학습 내용) 벼의 생육 시기가 다르게 촬영된 5채널 (R, G, B, NIR, Red-Edge)의 분광 이미지를 기반으로, 벼의 생육 이상(도열병, 도복, 결주, 부진, 등)을 Segmentation 하는 모델을 학습
(학습 비율) 전체 벼 생육이상 인식 데이터 200,910장을 학습 데이터(80%) 검증 데이터(10%), 시험 데이터(10%)로 나누어 모델의 학습 및 평가에 적용□ 서비스 활용 시나리오
● 벼 생육이상 판별 결과에 따른 벼 수확량 및 피해량 예측 서비스
- SegFormer 모델이 판별한 Segmentation 구간을 실제 논 면적과 대치하여 정상 벼의 면적을 계산하고, 벼 생산량 산정에 활용 가능
- 벼 수확량을 산정하여 쌀 수급 효율화 및 안정화에 기여할 수 있을 것으로 기대
● 성장기 별 벼 생육이상 분류 서비스
- 성장기별 벼 생육이상 발생의 차이에 따라, 특정 시기별 발생하는 벼 생육이상 종류와 발생 구간을 자동으로 분류하는 서비스 개발 가능
- 벼 생육이상 인식 데이터를 촬영시기별로 분류하여 모델에 학습해야 가능한 서비스
- 시기별 벼 생육이상 발생 정도의 측정과 비교를 통해, 재해 시 농작물 피해 조사에 활용 가능할 것으로 기대
● 벼 자동인식 지능형 병해충 방제 서비스
- 저고도에서의 벼 인식 모델(배경 vs 벼)을 개발하고, 이를 농업용 드론에 탑재하여 벼 자동인식 지능형 병해충 방제 서비스 제공 가능
- 벼 생육이상 인식 데이터를 배경과 벼(정상, 도복, 도열, 결주, 생육부진)로 분류 가능한 모델을 구현해야 가능한 서비스
- 벼 자동 인식 지능형 병해충 방제 시스템 도입을 통해, 농촌의 노동력 문제 해소, 방제시간 단축, 영농비 절감 등 기대 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 정상 vs 도복 세그멘테이션 정확도 Object Detection SegFormer Accuracy(Pixel 단위) 90 % 90.46 % 2 정상 vs 도열 세그멘테이션 정확도 Object Detection SegFormer Accuracy(Pixel 단위) 80 % 87.23 % 3 정상 vs 결주 세그멘테이션 정확도 Object Detection SegFormer Accuracy(Pixel 단위) 80 % 82.64 % 4 정상 vs 생육부진 세그멘테이션 정확도 Object Detection SegFormer Accuracy(Pixel 단위) 80 % 81.21 % 5 정상 vs 생육이상(도복, 도열, 결주, 생육부진) 세그멘테이션 정확도 Object Detection SegFormer Accuracy(Pixel 단위) 70 % 86.69 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드어노테이션 포맷
어노테이션 포맷 No 한글명 영문명 타입 필수여부 1 이미지 정보 IMAGES object Y 1-1 이미지 이름 IMAGE_FILE_ID string Y 1-2 이미지 크기 PHOTO_FILE_MG array Y 1-3 이미지 포맷 IMAGE_FILE_FRMAT string Y 1-4 촬영 장소 POTOGRF_PLACE_NM string Y 1-5 기계 모델 MCHN_MODL_NM string Y 1-6 카메라 기기 CMRA_NM string Y 1-7 해상도 RSOLTN string Y 1-8 촬영 고도 POTOGRF_ATTD number Y 1-9 수확량 HVST_QY number 1-10 촬영 기관 POTOGRF_INSTT string Y 1-11 촬영 일자 POTOGRF_DATETM string Y 1-12 시작 시간 BEGIN_TIME string Y 1-13 종료 시간 END_TIME string Y 1-14 비행 속도 FLYING_VE number Y 1-15 비행 방향 FLYING_DRC string Y 1-16 촬영 이미지 중복도_수평 HRZNTL_DPLCT_OF_POTOGRF_IMAGE number Y 1-17 촬영 이미지 중복도_수직 VERTCL_DPLCT_OF_POTOGRF_IMAGE number Y 1-18 반사판 유무 RFLBRD_ENNC string Y 1-19 풍속 WS string Y 1-20 운량 AMTCLD string Y 1-21 저작권 동의 여부 CPYRHT_USE_AGRE_AT string Y 2 가공 정보 ANNOTATIONS object Y 2-1 작물명 CROPS_NM string Y 2-2 생육 단계 코드 GRWH_STEP_CODE string Y 2-3 객체 클래스 코드 OBJECT_CLASS_CODE string Y 2-4 폴리곤 X 좌표 PYN_XCRDNT array Y 2-5 폴리곤 Y 좌표 PYN_YCRDNT array Y 실제예시
{
"IMAGES": {
"IMAGE_FILE_ID": "R20220804A25B2028",
"PHOTO_FILE_MG": [
512,
512
],
"IMAGE_FILE_FRMAT": "tif",
"POTOGRF_PLACE_NM": "충청남도, 서산시, 부석면, 간월도리",
"MCHN_MODL_NM": "Trinity F90+",
"CMRA_NM": "Altum",
"RSOLTN": "6.63 cm / 2.61 in",
"POTOGRF_ATTD": 149,
"HVST_QY": null,
"POTOGRF_INSTT": "DIA",
"POTOGRF_DATETM": "2022-08-04",
"BEGIN_TIME": "10:00:00",
"END_TIME": "10:50:00",
"FLYING_VE": 17,
"FLYING_DRC": "남-북",
"HRZNTL_DPLCT_OF_POTOGRF_IMAGE": 75,
"VERTCL_DPLCT_OF_POTOGRF_IMAGE": 75,
"RFLBRD_ENNC": "유",
"WS": "3",
"AMTCLD": "구름조금",
"CPYRHT_USE_AGRE_AT": "동의"
},
"ANNOTATIONS": [
{
"CROPS_NM": "벼",
"GRWH_STEP_CODE": "유수형성기",
"OBJECT_CLASS_CODE": "04",
"PYN_XCRDNT": [
331,
328,
327,
327,
326,
...
],
-
데이터셋 구축 담당자
수행기관(주관) : ㈜공간정보
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김종전 1688-9396 [email protected] 총괄 및 수집, 정제기관 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜선영종합엔지니어링 수집, 정제기관 뉴레이어㈜ 가공기관, 검수기관 ㈜무한정보기술 검수기관. AI 학습모델 ㈜다이아 수집기관 ㈜데이터에듀 정제기관 ㈜인피닉 가공, 검수기관 광주과학기술원 AI 학습모델 국립농업과학원 품질 검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김종전 1688-9396 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.