농산물 품질(QC) 이미지
- 분야농축수산
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2023-09-27 원천데이터, 라벨링데이터 수정 1.1 2023-06-30 원천데이터, 라벨링데이터 수정 1.0 2021-06-18 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
농산물 상품 등급 분류를 위한 농산물(20종) 상품 등급 이미지 데이터
구축목적
인공지능 학습을 위한 학습용 농산물 이미지 데이를 수집, 정제를 거친 후 메타데이터가 추가된 농산물의 품질을 판단하는 AI학습용 데이터를 만드는 것이 목적인 데이터셋
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/30만 -
구축 내용 및 제공 데이터량
- 원문데이터 60만 건 (농산물 10 품목에 대하여 각 6만 건 씩 확보하여 농산물 품질 기준으로 특, 상, 보통 품으로 분류)을 활용하여 확보된 원시데이터 60만 건 중 정제과정을 거쳐 30만 건 선정, 가공/검수 검증 작업을 거쳐 AI응용서비스에 적용하여 AI응용서비스 개발 (농산물 품질 검증 App, Web 버전)
- 데이터 세부사항
데이터 세부사항 표 구조 1. 파일 유형 : png
2. 파일명 : 작물명_형태 대상 농작물을 촬영한 이미지 파일 품질 - 해상도(1만 화소 이상) AI 학습 모델 머신 러닝에 실질적으로 활용할 데이터
- 해상도(100만 화소 이상) 이미지 및 가공 처리로 품질 높음가공 형태 1. 이미지 전처리
- 인공지능이 학습 가능한 형태로 이미지 파일 편집
2. 이미지 라벨링
- 농산물 품질등급에 따라 이미지 분류
3. 파일네이밍
- 데이터 관리의 용이성을 위하여 파일명을 수정메타데이터 작물의 종류, 품종의 종류, 촬영각도, 촬영장비, 촬영장소, 촬영날짜, 장소, 크기, 부피 라이선스 직접 촬영한 데이터로 라이선스 없음
- 원문데이터 60만 건 (농산물 10 품목에 대하여 각 6만 건 씩 확보하여 농산물 품질 기준으로 특, 상, 보통 품으로 분류)을 활용하여 확보된 원시데이터 60만 건 중 정제과정을 거쳐 30만 건 선정, 가공/검수 검증 작업을 거쳐 AI응용서비스에 적용하여 AI응용서비스 개발 (농산물 품질 검증 App, Web 버전)
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 농산물 객체 분류 모델 Image Classification Inception V3 F1-Score 0.85 점 0.89 점
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
농심물 품질 이미지-데이터변경이력 버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 인공지능 학습을 위한 학습용 농산물 이미지 데이를 수집, 정제를 거친 후 메타데이터가 추가된 농산물의 품질을 판단하는 AI학습용 데이터를 만드는 것이 목적인 데이터셋
활용 분야
- 농산물 10종의 품질을 국가가 정해놓은 기준으로 일반소비자 또는 농가에서 인공지능 프로그램을 이용하여 정확하게 파악할 수 있는 기준을 제공하는 데이터셋으로서 농산물 품질에 대한 AI 요약기술 개발에 용이함
소개
- 우리나라 농산물 중 시설재배 품목을 제외, 소비량이 많고 수입 의존도가 낮은 10개의 품목을 선정 : 농림축산식품부 농산물 도매시장 통계연보 (2017년, 2018년)를 참조하여 과제 수행 기간에 이미지 확보에 어려움이 없고 거래량이 충분한 상위 10개의 청과품목 (무, 배추, 양파, 마늘, 양배추, 감, 사과, 배, 감귤, 감자)를 선정하여 농산물 품질을 구분할 수 있는 기준과 품질 분류를 제공하는 원천 데이터를 확보
구축 내용 및 제공 데이터량
- 원문데이터 60만 건 (농산물 10 품목에 대하여 각 6만 건 씩 확보하여 농산물 품질 기준으로 특, 상, 보통 품으로 분류)을 활용하여 확보된 원시데이터 60만 건 중 정제과정을 거쳐 30만 건 선정, 가공/검수 검증 작업을 거쳐 AI응용서비스에 적용하여 AI응용서비스 개발 (농산물 품질 검증 App, Web 버전)
- 데이터 세부사항
데이터 세부사항 표 구조 1. 파일 유형 : png
2. 파일명 : 작물명_형태 대상 농작물을 촬영한 이미지 파일 품질 - 해상도(1만 화소 이상) AI 학습 모델 머신 러닝에 실질적으로 활용할 데이터
- 해상도(100만 화소 이상) 이미지 및 가공 처리로 품질 높음가공 형태 1. 이미지 전처리
- 인공지능이 학습 가능한 형태로 이미지 파일 편집
2. 이미지 라벨링
- 농산물 품질등급에 따라 이미지 분류
3. 파일네이밍
- 데이터 관리의 용이성을 위하여 파일명을 수정메타데이터 작물의 종류, 품종의 종류, 촬영각도, 촬영장비, 촬영장소, 촬영날짜, 장소, 크기, 부피 라이선스 직접 촬영한 데이터로 라이선스 없음
대표도면
대표도면 카메라 위치 Top 1 카메라 FR 45o
2 카메라FR 90o
3 카메라DI 45o
4 카메라DI 90o
5 카메라이미지
각도이미지 번호 1 2 3 4 5 0o 6 7 8 9 10 90o 11 12 13 14 15 180o 16 17 18 19 20 270o ↓상품의 뒷면 카메라 위치 Top 1 카메라 FR 45o
2 카메라FR 90o
3 카메라DI 45o
4 카메라DI 90o
5 카메라이미지
각도이미지 번호 21 22 23 24 25 0o 26 27 28 29 30 90o 31 32 33 34 35 180o 36 37 38 39 40 270o <5대 카메라를 이용한 농산물 이미지 촬영 방법>
필요성
- 인공지능 개발을 위한 학습용 데이터는 방대한 양과 목적에 맞는 양질의 데이터를 필요로 함
- 농산물 품질(QC) 이미지 데이터셋의 경우, 이를 위하여 명확하게 목표를 수립하고 대상 영역에 대한 분석, 데이터의 수집 방안, 가공 및 수립 방안, 수집된 데이터의 품질 평가 및 관리 방안, 최신 데이터의 확보를 통한 학습용 데이터의 최적화 방안이 마련되어야 함
- 농산물 품질 데이터 수집/저장/정제 도구를 활용하여 농산물 품질에 대한 AI응용서비스 개발을 위하여 반드시 필요한 데이터셋
데이터 구조
- 데이터 구성
데이터 세부사항 표 구조 1. 파일 유형 : png
2. 파일명 : 작물명_형태 대상 농작물을 촬영한 이미지 파일 품질 - 해상도(1만 화소 이상) AI 학습 모델 머신 러닝에 실질적으로 활용할 데이터
- 해상도(100만 화소 이상) 이미지 및 가공 처리로 품질 높음가공 형태 1. 이미지 전처리
- 인공지능이 학습 가능한 형태로 이미지 파일 편집
2. 이미지 라벨링
- 농산물 품질등급에 따라 이미지 분류
3. 파일네이밍
- 데이터 관리의 용이성을 위하여 파일명을 수정메타데이터 작물의 종류, 품종의 종류, 촬영각도, 촬영장비, 촬영장소, 촬영날짜, 장소, 크기, 부피 라이선스 직접 촬영한 데이터로 라이선스 없음
- 어노테이션 포맷
어노테이션 포맷 표 no 항목명 설명 필수여부 1 image 이미지 정보 Y 1-1 identifier 파일명 1-2 imsize 이미지 파일 크기 Y 1-3 copyright 이미지 저작권 소유자 1-4 date 데이터 취득 일자 1-5 resolution 해상도 Y 1-6 bit 비트값 Y 1-7 F-Stop 조리개 투과량 Y 1-8 exposure time 노출 시간 Y 1-9 ISO ISO 감도 Y 1-10 focal length 초점 거리 Y 1-11 full aperture 조리개 최대 개방 수치 Y 1-12 view angle 화각 1-13 white balance 화이트 밸런스 Y 1-14 depth RGB 여부 2 regions 관련 정보 2-1 type 어노테이션 종류 2-2 boxcomers 어노테이션 좌표 값 2-3 ansize 이미지 영역 사이즈 2-4 class 클래스명 2-5 tags 분류항목
2-5-1 truncated 대상체 잘림 여부 2-5-2 종ID 종 아이디 정보 Y 2-5-3 과일 종류 과일 종류 정보 Y 2-5-4 품질 등급 품질 등급 정보 Y 2-5-5 촬영면 상, 하부 정보 Y 2-5-6 verticality angle 촬영 수직각도 Y 2-5-7 horizontality angle 촬영 수평각도 Y 2-5-8 height 품목의 높이 Y 2-5-9 width 품목의 너비 Y 2-5-10 weight 품목의 무게 Y 2-5-11 Instance 대상체 2-5-12 Instance Upper 대상체 상위 레벨 2-5-13 GPS 위도 GPS 위도 값 2-5-14 GPS 경도 GPS 경도 값 2-6 instance_uri 온톨로지 uri 정보 2-7 2-7-1 sem_ext 의미확장 정보
2-7-2 property:locatedln 의미확장 지역정보 Y 2-7-3 property:relatedTerm 의미확장 연관정보 2-7-4 property:description 의미확장 상세정보
-
데이터셋 구축 담당자
수행기관(주관) : 경북대학교
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 홍동혁 053-956-7006 [email protected] · 원천 데이터 촬영 및 현지 조사 · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 경북대학교 · 데이터 수집 기획, 데이터 수집, 데이터 저장 기바인터내셔날(주) · 농산물 품질(QC) 이미지 수집, 정제, 가공, 검수, 검증
· 데이터 서버 관리
· 크라우드 소싱 플랫폼 개발
· AI응용서비스 BETA 개발 기획, 응용서비스 개발혁신과미래 사회적협동조합 · 요약문 작성(크라우드소싱 활용)
크라우드소싱 플랫폼 관리, 크라우드 워커 인력관리(주)이노하이퍼 · AI 모델 개발 기획, 정제, 가공 업무 (주)이조인테크 · AI 요약모델을 활용한 응용서비스 개발 기획, 데이터 검수 업무 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 홍동혁(경북대학교) 053-956-7006 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.