노지작물(배추 등) 작황 데이터
- 분야농축수산
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-13 데이터 최종 개방 1.0 2023-07-25 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-20 산출물 전체 공개 소개
ㆍ수급 민감 채소(배추, 무)의 신속한 재배면적 산출 등을 위한 드론 영상기반 주요 채소 작물 구분용 학습용 데이터 ㆍ수급 민감 채소에 대한 구축된 데이터를 통해 수급조절을 위한 생산량 예측 인공지능 개발용 공공데이터
구축목적
ㆍ노지작물에 대한 최적의 생육조건 및 수확시기를 인공지능 기술을 통해 예측하고 최적의 생육 정보를 농업인에게 제공하는 AI 학습용 통합 데이터 구축 ㆍ노지작물 재배 시 정밀농업 구현을 위해 작물의 생리 상태 진단을 위한 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 TIFF 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 json 데이터 활용 서비스 AI 기반 생산량 예측, 생육환경 진단기술 등 농업에 빅데이터를 접목하여 안정적 인공지능 학습용 공공데이터 활용 데이터 구축년도/
데이터 구축량2022년/이미지 데이터, 라벨링 데이터 20만장 어노테이션 데이터 38만건 -
1. 학습용 데이터 구축 규모
1. 학습용 데이터 구축 규모 구분 성과목표 구축실적 달성율 데이터셋 다중분광 촬영 이미지 데이터 200,000장 200,000장 100% 배추 생산량 데이터 500건 500건 100% 무 생산량 데이터 500건 500건 100% 학습모델 평가지표 (mIoU) 배추,무 평균 80% 배추,무 평균 102.80% 82.23% 2. 데이터 분포
2. 데이터 분포 이미지 지역분포 수량 비율 이미지 강원도 27,300장 14% 전라도 94,890장 47% 제주도 67,245장 34% 충청도 10,565장 5% 총 구축 규모 200,000 100% 2. 데이터 분포 노지작물 작황데이터 (tif+json) 작물명 지역 구축 수량 비율 노지작물 작황데이터 (tif+json) 배추 강원도 20,580 10.29% 전라도 80,730 40.37% 충청도 10,565 5.28% 제주도 145 0.07% 무 강원도 6,125 3.06% 전라도 14,140 7.07% 제주도 65,325 32.66% 기타 강원도 595 0.30% 전라도 20 0.01% 제주도 1,775 0.89% 총 구축 규모 200,000 100% 2. 데이터 분포 어노테이션 품종 생육단계 구축 수량 비율 어노테이션 배추 정식기 22,895 6% 경업신장기 107,305 28% 결구기 89,290 24% 무 유묘기 59,340 16% 엽신장기 34,695 9% 근비대기 24,140 6% 기타 - 40,710 11% 총 구축 규모 378,375 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델 학습
1. 이미지 분할(Image Segmentation) 모델
● 이미지로부터 노지작물 영역을 검출하기 위한 신경망 모델은, 매우 적은 수의 학습 데이터로도 정확한 이미지 세그멘테이션 성능을 가지고 있는 U-net(Convolutional Networks for Biomedical Image Segmentation) 모델을 사용함
● U-net은 Contracting Path와 Expanding Path로 이루어져 있으며 Contracting path에서 추출한 특징맵을 Expanding Path에 다시 사용하여 적은 데이터로도 높은 정확성을 도출하는 것으로 알려진 모델
2. 분류(classification) 모델
● 세그멘테이션에서 나온 판독부터 작물 분류하기 위한 신경망 모델은, 최근 분류모델 중에서 탁월한 성능을 발휘하고 있는 EfficientNet 모델을 사용함
● 모델의 깊이, 너비, 입력 이미지의 크기 조정을 통해 딥러닝 모델의 성능을 향상시킬 수 있는데 EfficientNet은 이 3가지 방법을 효율적으로 적용할 수 있는 복합 스케일링(compound scaling)방법을 사용하는 모델임3. 전처리
● 학습을 위해 모든데이터는 0~1 사이의 값을 가지도록 minmax정규화와 5장의 밴드(R,G,B,NIR,RedEdge)영상을 5채널영상으로 만드는 전처리 과정을 거침
― 정규화 식 : (Image - min) / (max – min)
― (800, 800, 1) × 5의 영상을 (800, 800, 5)영상으로 변환4. 학습
● 별도의 리사이징은 하지 않고 원본 영상 사이즈(800 픽셀)을 그대로 사용함
● 데이터셋 분할은 hold-out 기법에 의한 학습/검증/테스트로 분할하였고 비율은 80:10:10이며, 각 데이터셋의 수량은 16만장:2만장:2만장이다.4. 학습 파라미터 설정값 Epoch 100 Running_rate 0.0001 Batch_size 8 Loss function focal_loss 5. 판독 결과
● 평가방법 : mIoU(Mean Intersection over Union)
― IoU(Intersection over Union)의 계산 방법으로 학습데이터의 참값(ground truth)값과 모델을 통해 예측된 결과값의 교차영역의 넓이의 합영역을 두영역의 합영역의 넓이값으로 나눈 값으로 일반적으로 IoU(Intersection over union) 값이 0.5 이상이면 정상 판독(TP) 되었다고 판단함,― mIoU는 위에서 설명한 IoU를 클래스별로 구한 후 class 종류(수)로 나눈 값.
― mIoU 계산식: class별 IoU의 합 / class 종류(수)5. 판독 결과 다중분광 영상 Ground Truth U-Net EfficientNet 5. 판독 결과 평균 mIoU 작물 평균 mIoU 무, 배추, 기타작물 82.2362 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 세그멘테이션 객체(배추, 무) 탐지 Object Detection U-net, EfficientnetB0 mIoU 80 % 80.12 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
- 학습데이터의 형태는 분광정보가 포함된 이미지데이터(.Tiff)와 이미지데이터와 매칭되어 생육이상정보가 포함된 Json형태의 파일로 포맷을 구성1. 데이터 포맷 원천데이터 구분 데이터 포맷 드론 촬영 TIFF → 어노테이션 JSON 정사영상 이미지 라벨링 데이터 생산량
데이터TXT 생산량 데이터 2. 데이터 구성
1) 이미지정보 테이블 구조2. 데이터 구성 1) 이미지정보 테이블 구조 구분 항목 필드명 타입 필수여부 비고 이미지 정보 원천데이터명 FILENAME String Y 정사영상 최소값 STATISTICS_MIN Number Y 정사영상 최대값 STATISTICS_MAX Number Y 정사영상 파일명 FILE_ID String Y 이미지 파일 크기 FILE_MG Number Y 이미지 파일 포멧 FILE_FRMAT String Y 카메라 정보 CMRA_INFO String Y 카메라 기기명 CMRA_NM String Y IP카메라 아이디 IPCMRA_ID String Y 촬영 기관 POTO_INSTT String Y 촬영일자 POTO_DATE String Y 촬영시작시간 BEGIN_TIME String Y 촬영종료시간 END_TIME String Y 촬영장소명 PLACE_NM String Y 풍속 WS Number Y 운량 AMTCLD String Y 촬영고도 POTO_ATTD Number Y 촬영이미지중복도(수평) H_RDCY Number Y 촬영이미지중복도(수직) V_RDCY Number Y 반사판 촬영 유무 CRPSHT String Y 경도 ENVRN_LO String Y 위도 ENVRN_LA String Y 촬영드론 비행속도 FLYING_VE String Y 촬영드론 비행방향 FLYING_DRC String Y 영상처리프로그램명 NM String Y 복사보정 수준 RADLVL String Y 기하보정 수준 GEOLVL String Y 좌표계(EPSG) CNTM String Y 지상해상도(Cm/pxcel) RSOLTN Number Y 저작권 동의 여부 CPYRHT_USE String Y 2) 가공정보 테이블 구조
2. 데이터 구성 2) 가공정보 테이블 구조 구분 항목 필드명 속성 필수여부 비고 가공 정보 스마트팜맵 ID POTOGRF_PLACE_INFO String Y 재배작물구분 CTVT_CROPS_SPCHCKN String Y 생육단계코드 GRWH_STEP_CODE String 수확일자 HVST_DATETM String 현장조사 재식주수 TRCN Number 현장조사 생산성 PRDCTV Number 현장조사 작물평균무게 CROPS_AVRG_WT Number 현장조사 하품 비율 LWQLG_RATE Number 현장조사 생산량 OUTTRN Number 현장조사 세그멘테이션 X좌표 SEGMENTATION_X_
COORDINATEString 세그멘테이션 Y좌표 SEGMENTATION_Y_ COORDINATE String 작물재배 제외구역경계 INTERIORS String 3. 어노테이션 포맷
1) 어노테이션 속성 정보3. 어노테이션 포맷 1) 어노테이션 속성 정보 No. 항 목 타입 길이 필수여부 비고 한글명 영문명 1 기본정보 INFO 1-1 원천데이터명 FILENAME 문자 20 Y 1-2 정사영상 최소값 STATISTICS_MIN 숫자 8 N 1-3 정사영상 최대값 STATISTICS_MAX 숫자 8 N 2 이미지정보 2-1 정사영상 파일명 FILE_ID 문자 50 Y 2-2 이미지 파일 크기 FILE_MG 숫자 20 Y 2-3 이미지 파일 포멧 FILE_FRMAT 문자 10 Y 2-4 카메라 정보 CMRA_INFO 문자 20 Y 2-5 카메라 기기명 CMRA_NM 문자 20 Y 2-6 IP카메라 아이디 IPCMRA_ID 문자 10 Y 2-7 촬영 기관 POTO_INSTT 문자 7 Y 2-8 촬영일자 POTO_DATE 문자 10 Y 2-9 촬영시작시간 BEGIN_TIME 문자 8 Y 2-10 촬영종료시간 END_TIME 문자 8 Y 2-11 촬영장소명 PLACE_NM 문자 100 Y 2-12 풍속 WS 숫자 2,1 Y 2-13 운량 AMTCLD 문자 5 Y 2-14 촬영고도 POTO_ATTD 숫자 3 Y 2-15 촬영이미지중복도(수평) H_RDCY 숫자 2 Y 2-16 촬영이미지중복도(수직) V_RDCY 숫자 2 Y 2-17 반사판 촬영 유무 CRPSHT 문자 2 Y 2-18 경도 ENVRN_LO 문자 20 Y 2-19 위도 ENVRN_LA 문자 20 Y 2-20 촬영드론 비행속도 FLYING_VE 문자 3 Y 2-21 촬영드론 비행방향 FLYING_DRC 문자 10 Y 2-22 영상처리프로그램명 NM 문자 20 Y 2-23 복사보정 수준 RADLVL 문자 30 Y 2-24 기하보정 수준 GEOLVL 문자 30 Y 2-25 좌표계(EPSG) CNTM 문자 4 Y 2-26 지상해상도(Cm/pxcel) RSOLTN 숫자 2,1 Y 2-27 저작권 동의 여부 CPYRHT_USE 문자 10 3 가공 정보 ANNOTATIONS 3-1 스마트팜맵 ID POTOGRF_PLACE_INFO 문자 30 Y 3-2 재배작물구분 CTVT_CROPS_SPCHCKN 문자 5 Y 3-3 생육단계코드 GRWH_STEP_CODE 문자 10 3-4 수확일자 HVST_DATETM 문자 10 현장조사 3-5 재식주수 TRCN 숫자 3 현장조사 3-6 생산성 PRDCTV 숫자 6,3 현장조사 3-7 작물평균무게 CROPS_AVRG_WT 숫자 5 현장조사 3-8 하품 비율 LWQLG_RATE 숫자 6,3 현장조사 3-9 생산량 OUTTRN 숫자 9,1 현장조사 3-10 세그멘테이션 X좌표 SEGMENTATION X COORDINATE 문자 가변 3-11 세그멘테이션 Y좌표 SEGMENTATION Y COORDINATE 문자 가변 3-12 작물재배 제외구역경계 INTERIORS 문자 가변 4. 실제 예시
{
"INFO": {
"FILENAME": "220927HN003B0074.tif",
"STATISTICS_MIN": "0.003429",
"STATISTICS_MAX": "1.524027"
},
"IMAGES": {
"FILE_ID": "adi_geom_11_전남_해남_옥천_220927_01_pb_r_redm_HN003",
"FILE_MG": 2304.0,
"FILE_FRMAT": "tif",
"CMRA_INFO": "MicaSense",
"CMRA_NM": "Rededge-M",
"IPCMRA_ID": "RM01-1833073-SC",
"POTO_INSTT": "geom",
"POTO_DATE": "2022-09-27",
"BEGIN_TIME": "09:36",
"END_TIME": "11:41",
"PLACE_NM": "전남, 해남군, 옥천면, 용산리, 515-2",
"WS": 4.0,
"AMTCLD": "맑음",
"POTO_ATTD": 110,
"H_RDCY": 75,
"V_RDCY": 75,
"CRPSHT": "유",
"ENVRN_LO": "126.656079378968",
"ENVRN_LA": "34.5920892732361",
"FLYING_VE": "5",
"FLYING_DRC": "북-남",
"NM": "Pix4Dmapper",
"RADLVL": "반사도변환",
"GEOLVL": "GNSS",
"CNTM": "5179",
"RSOLTN": 8.5,
"CPYRHT_USE": "동의"
},
"ANNOTATIONS": [
{
"POTOGRF_PLACE_INFO": "08023826",
"CTVT_CROPS_SPCHCKN": "배추",
"GRWH_STEP_CODE": "경업신장기",
"HVST_DATETM": null,
"TRCN": 11,
"PRDCTV": 18.182,
"CROPS_AVRG_WT": 1547,
"LWQLG_RATE": 81.818,
"OUTTRN": 935.9,
"SEGMENTATION_X_COORDINATE": [
281,
270,
263,
223,
144,
127,
110,
59,
28,
0,
0,
6,
16,
36,
65,
83,
89,
157,
168,
181,
248,
274,
319,
344,
347,
352,
352,
349,
341,
342,
342,
337,
310,
283
],
"SEGMENTATION_Y_COORDINATE": [
382,
400,
404,
359,
281,
271,
264,
249,
242,
238,
196,
192,
191,
184,
164,
158,
158,
133,
134,
132,
176,
192,
225,
248,
258,
278,
278,
283,
291,
303,
305,
311,
339,
375
],
"INTERIORS": "[]"
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : ㈜공간정보
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김종전 1688-9396 [email protected] 총괄 및 수집, 정제기관 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜선영종합엔지니어링 수집, 정제기관 뉴레이어㈜ 가공기관, 검수기관 ㈜무한정보기술 검수기관. AI 학습모델 ㈜다이아 수집기관 ㈜데이터에듀 정제기관 ㈜인피닉 가공, 검수기관 광주과학기술원 AI 학습모델 국립농업과학원 품질 검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김종전 1688-9396 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.