콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#인삼 # 농업 # 년근 # 등급 # 판독 # 식별 # 분류

인삼 년근 판독 및 등급 식별을 위한 인공지능 학습데이터 구축

인삼 년근 판독 및 등급 식별을 위한 인공지능 학습데이터 구축 아이콘 이미지
  • 분야농축수산
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 4,964 다운로드 : 142 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-27 데이터 최종 개방
    1.0 2023-05-26 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-02-27 산출물 전체 공개

    소개

    인삼의 년근을 판독하고 등급을 식별하기 위한 인공지능 학습용 데이터

    구축목적

    1. 부정유통 방지 방안 필요 및 품질검사 효율성 증대 필요.
    2. 고령화 대비 및 경영비용 절감
  •  
    항목 과제 구분 구분 비율 설명
    원수삼 부위별 바운딩 박스 공통 전신 25% 바운딩시 4개의 부위를 바운딩하여 부위 태깅을 진행함
    머리 25%
    몸통 25%
    다리 25%
    재배방식 분포 공통 이식삼 0.46%  
    직파삼 99.54%
    세척 전후 분포 공통 세척전 99.80%  
    세척후 0.20%
    인삼 년근 공통 4년근 25.76%  
    5년근 43.89%
    6년근 30.35%
    인삼 등급 공통 30.10%  
    29.37%
    40.53%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    모델학습
    1. 학습모델 후보

    1. 학습모델 후보
    데이터 명  인삼
    학습 모델 후보  알고리즘  성능지표  선정 여부  선정 사유
    인삼 부위 탐지 모델 YOLOv5 부위 탐지 [email protected] 90%이상 1순위
    인삼 년근 및 등급 탐지 모델 YOLOv5 년근 및 등급 탐지 f1-score 90%이상 1순위
    인삼 년근 및 등급 분류 모델 EfficientNet B7 년근 및 등급 분류 f1-score 90%이상 X 2순위

     

    2. 인공지능 학습모델 선정 기준 및 고려사항

    2. 인공지능 학습모델 선정 기준 및 고려사항
    구분 고려사항 설명
    1 적합성 주요 노지작물 학습 데이터셋 구축 목적에 적합한 학습모델인가
    2 활용성 정밀농업 및 스마트팜에서 분야 및 농업인에서 활용성이 높은 학습 모델인가
    3 실현가능성 구축된 학습데이터셋을 활용하여 실제 농사에 적용하고 실현가능성이 높은 모델인가
    4 선정절차 1) 선정기준 적합한 후보 리스트업
    2) 내부 연구원 대상 설문조사를 통해 우선순의 도출
    3) 1cycle 학습모델 개발
    4) 성능평가
    5) 최종 학습모델 선정

     

    3. 인공지능 학습 모델 후보군 적합성 검토 결과

    3. 인공지능 학습 모델 후보군 적합성 검토 결과
    후보학습모델 적합성 활용성 실현가능성 선정여부
    인삼 부위 탐지 모델
    인삼 년근 및 등급 탐지 모델

     

    4. 기타
    - 인삼은 성장하는 생물이므로 4년근/5년근/6년근으로 분류할 수 있으나 대/중/소는 만으로는 분류할 수 없다. 그래서 4년근대/4년근중/4년근소/5년근대 등 처럼 년근과 등급을 함께 혼합하여 9단계로 클래스를 구분한다.
    - 인삼 1두당 각도를 달리하여 총 6개의 이미지를 생성함. 그러므로 학습/검증/테스트로 이미지를 분리할 때 동일한 인삼이 학습/검증/테스트로 섞이지 않도록 하는 것을 제안함

     

    서비스 활용 및 시나리오
    - 출하가 집중되는 특정기간(6~8월)에 품질 검사 및 업무 효율성 증대
    - 실시간 품질(년근/등급)서비스 제공
    - 육안으로만 등급을 검사하는 현재 시스템에 AI를 통한 신뢰 높은 서비스 제공

    서비스 활용 및 시나리오 이미지

    기타정보
    - 대표성 : 인삼은 가장 많이 유통되는 4년근, 5년근, 6년근으로 구성
    - 독립성 : 인삼 학습데이터 수량은 그 해 실제 생산 및 유통되는 인삼의 수에 영향을 받으며 2022년에는 4년근의 수량이 5년/6년근 보다는 적게 생산됨

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 년근 및 등급 탐지 성능 Image Classification YOLO v5 (YOLOv5s) F1-Score 90 99.35
    2 인삼 탐지 성능 Object Detection YOLO v5 (YOLOv5s) mAP 90 % 98.9 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 포맷

    1. 데이터 포맷
    구분 No 속성명 속성 및 내용
    필수  1 ginseng_id 인삼 고유 아이디
    필수 2 license 이미지 적용 라이선스
    필수 3 file_name 이미지파일이름
    필수 4 date_captured 촬영날짜(년,월),시간
    필수 5 origin 재배장소(원산지) 카테고리 고유 번호
    필수 6 category_id_varieties 인삼품종 카테고리 고유 번호
    필수 7 category_id_age 년근 카테고리 고유 번호
    필수 8 category_id_grade 등급 카테고리 고유 번호
    필수 9 category_id_method 재배방식 카테고리 고유 번호
    필수 10 category_id_wash 세척여부 카테고리 고유 번호
    선택 11 category_id_cert 인증 구분
    선택 12 category_id_store 보관 방법
    선택 13 temperature 촬영 시 온도
    선택 14 humidity 촬영 시 습도
    선택 15 date_seed 파종 시기 (파종 일시)
    선택 16 date_harvest 수확 시기 (수확 일시)
    선택 17 storeperiod 보관 기간 (YY-MM)
    필수 18 iscrowd 객체의 단일 여부(단일 : 0, 다중 : 1)
    필수 19 image_id 이미지 아이디
    필수 20 area 바운딩 박스의 면적
    필수 21 bbox bounding box 정보

     

    2. 어노테이션 포맷

    2. 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 info Object 필수 데이터셋 정보    
      1-1 info.description String 필수 데이터셋 이름    
    1-2 info.url String 선택 데이터셋 제작자 url    
    1-3 info.version String 선택 제작 버젼    
    1-4 info.year Integer 선택 제작 년도    
    1-5 info.contributor String 선택 제공자    
    1-6 info.date_created String 선택 제작시간    
    2 images   필수      
      2-1 images[].id Integer 필수 이미지 아이디 (일련번호)    
    2-2 images[].ginseng_id Integer 필수 인삼 고유 아이디    
    2-3 images[].file_name String 필수 이미지파일이름    
    2-4 images[].date_captured String 필수 촬영일시    
    2-5 images[].temperature Number 선택 촬영 시 온도    
    2-6 images[].humidity Number 선택 촬영 시 습도    
    2-7 images[].origin String 필수 재배장소(원산지)    
    2-8 images[].date_seed String 선택 파종 시기    
    2-9 images[].date_harvest String 선택 수확 시기    
    2-10 images[].storeperiod String 선택 보관 기간    
    2-11 images[].category_id_varieties Integer 필수 인삼품종 카테고리 0  
    2-12 images[].category_id_age Integer 필수 년근 카테고리  1001~1003  
    2-13 images[].category_id_grade Integer 필수 등급 카테고리  2001~2003  
    2-14 images[].category_id_method Integer 필수 재배방식 카테고리  4001, 4002  
    2-15 images[].category_id_cert Integer 선택 인증구분 카테고리  5001, 5002  
    2-16 images[].category_id_store Integer 선택 보관방법 카테고리  6001~6003  
    2-17 images[].category_id_wash Integer 필수 세척여부 카테고리 7001, 7002  
    3 annotations Object 필수      
      3-1 annotations[].id   필수 어노테이션 아이디    
    3-2 annotations[].iscrowd   선택 객체의 단일 여부 0 or 1  
    3-3 annotations[].image_id   필수 이미지 아이디    
    3-4 annotations[].area   필수 면적    
    3-5 annotations[].bbox Object 필수 바운딩 정보    
      bbox[].items Number 필수 바운딩 값    
    3-6 annotations[].category_id_region Integer 필수 부위 카테고리  3001~3004  
    4 categories Object 필수      
      4-1 categories[].supercategory String 필수 카테고리명    
    4-2 categories[].id Integer 필수 카테고리 아이디값    
    4-3 categories[].name String 필수 카테고리값 이름  
     
     
     
      No Field name Length Meaning
      a age 4 4년근(1001), 5년근(1002), 6년근(1003)
      b grade 4 대(2001), 중(2002), 소(2003)
    c date_captured   8 날짜(yyyymmdd)
    d ginseng_id   n 인삼아이디(n)
    e image_id   6 이미지 일련번호(ex. 000535)
    num file name   6 ex) 1002_2001_20220913_10_000535.json

     

    3. JSON 데이터 예시
    JSON 데이터 예시

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜엑소텍
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    최석희 070-4492-1845 [email protected] 학습모델 구현
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜세이소프트 데이터 수집, 정제, 가공
    ㈜코덱스브리지 ㈜코덱스브리지
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    최석희 070-4492-1845 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.