-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2023-12-20 데이터 최종 개방 1.1 2023-10-19 데이터 추가 개방 1.0 2023-04-30 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-20 산출물 전체 공개 소개
비파괴 방식을 통해 진안홍삼의 내부품질(내공/내백) 데이터를 확보하기 위한 목적으로, 진안 내에 소재한 홍삼 가공업체 저장고에 비축된 진안홍삼의 X-ray 학습데이터 구축. 데이터 구축량은 360,000장이며, 홍삼 1개당 top, bottom, side 중 홍삼 형태에 따라 2개 단면에서 촬영(총 18만개 이상 홍삼 객체 사용)
구축목적
본 과제를 통해 구축된 학습 데이터를 통해 “홍삼 내부 품질 분류 프로세스”를 구축하여 기존 10년 이상 숙련된 전문가에 의해 이루어지던 홍삼 내부품질 분류 과정을 비 숙련자도 비파괴 방식으로 홍삼 내부의 품질을 파악할 수 있도록 하고, 홍삼 상품 품질의 신뢰성 및 홍삼 가공절차 효율성 향상시키고자 함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 JPG, CSV 데이터 출처 진안군 소재 “진안홍삼” 가공업체 및 농가 라벨링 유형 Bounding-Box 라벨링 형식 JSON 데이터 활용 서비스 홍삼 내부의 내공/내백 크기에 따라 홍삼의 품질을 분류하는 서비스 : - 홍삼 품질등급 분류 자동화 시스템 도입을 통해 홍삼 가공 농가/업체의 편의성 및 생산성 증대 기대 - 체계적인 홍삼 분류를 통한 지역 홍삼 상품의 신뢰성 확보 데이터 구축년도/
데이터 구축량2022년/진안홍삼 X-ray 이미지 36만 장 -
○ 데이터 구축 규모
데이터 구축 규모 구분 구축수량 구성비(%) 상 12,821 3.55 중 13,910 3.85 하 80,226 22.19 최하 254,533 70.41 합계 361,490 100
○ 데이터 분포 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드데이터 데이터명 진안홍삼 품질 데이터 학습 모델 인공지능 기반 진안 홍삼 품질 분류 모델 모델 YOLOv5 성능 지표 진안 홍삼 품질 분류 성능, F1-점수 60% 이상 개발 내용 - 구축되는 학습데이터를 활용하여 홍삼 등급표 기준으로 4등급 품질(상, 중, 하, 최하)을 분류하는 모델을 개발
- 한국인삼산업법에 고시된 “홍삼 등급표”에 근거하여 본 컨소시엄이 진안홍삼 품질등급 분류표”를 재구성함<진안홍삼 4등급 품질등급 분류표> 구분 상 중 하 최하 진안홍삼
4단계
품질분류내부조직이 치밀·견고하되, 머리 밑 10mm 이하부분을 절단시 내공·내백의 직경이 0.5mm 이하인 것으로 길이가 10mm 이하 인 것 내부조직이 치밀·견고하되, 머리 밑 10mm 이하부분을 절단시 내공·내백의 직경이 2.0mm 이하인 것으로 몸통길이의 1/4 이하 인 것 내백의 직경이 몸통직경의 1/3 이하이거나, 내공의 직경이 몸통직경의 1/2 이하인 것 내백의 직경이 몸통직경의 1/3 이상이거나, 내공의 직경이 몸통직경의 1/2 이상인 것 응용서비스 원형 홍삼의 취급을 활성화하고 그 품질을 판단하여 이를 토대로 AI 연구 및 학습데이터 검증 등에 활용이 가능 학습모델
결과 예시홍삼 객체의 영역과 클래스(품질 등급 : 상, 중, 하, 최하)를 분류
학습모델
결과 예시- 홍삼 X-ray 이미지 인식을 통해 홍삼의 내공/내백 유무 및 크기를 탐지하여 등급별 분류 가능
- 기존 10년 이상 숙련된 전문가에 의해 분류되던 홍삼 내부품질 분류 프로세스 효율화
- 체계적인 홍삼 분류를 통해 홍삼 상품 품질의 신뢰성 확보
- 인공지능 홍삼 내공/내백 측정 기술 보급화를 통한 홍삼 가공절차 효율성 향상
- 향후 학습 데이터의 활용자를 대상으로 한 교육자료로 활용 가능(관련분야 연구자, 농업관련 직무 종사자 등) -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 홍삼 품질 분류 성능 Image Classification YOLO v5 F1-Score 60 점 69.5 점
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드☐ 진안홍삼 품질 데이터
홍삼 내부의 내공·내백 크기에 따라 상, 중, 하 ,최하로 홍삼의 내부 품질을 분류하여 비 숙련자들도 비파괴 방식으로 홍삼내부의 내공·내백 유무 및 크기를 탐지하고 품질을 분류할 수 있도록 돕는 학습 데이터○ 데이터 구성
- 진안홍삼의 내부품질(내공/내백) 데이터 확보를 위한 목적으로, 진안 내에 소재한 홍삼 가공 업체/농가에 비축된 진안홍삼의 X-ray 학습데이터 구축
- 획득, 가공, 정제, 라벨링 등의 절차에 따라 사용되는 데이터는 주로 csv, jpg, json 포맷으로 확보
- 진안홍삼의 내부품질 등급 데이터를 AI 모델 학습 및 분류 성능 향상을 기반으로 구축<진안홍삼 품질 데이터 구축 개념도>
○ 진안홍삼 내부품질 등급 데이터
등급 데이터 원시데이터 대상 특성 1 상 내부조직이 치밀·견고하되, 머리 밑 10mm 이하부분을 절단 시 내공·내백의 직경이 0.5mm 이하인 것으로 길이가 10mm 이하인 것 2 중 내부조직이 치밀·견고하되, 머리 밑 10mm 이하부분을 절단 시 내공·내백의 직경이 2.0mm 이하인 것으로 몸통길이의 1/4 이하인 것 3 하 내백의 직경이 몸통직경의 1/3 이하이거나, 내공의 직경이 몸통직경의 1/2 이하인 것 4 최하 내백의 직경이 몸통직경의 1/3 이상이거나, 내공의 직경이 몸통직경의 1/2 이상인 것 ○ 원천 데이터
원천 데이터 구분 데이터 형식 2D Grayscale 포맷 JPG 해상도 1,9360*1,080 원천 데이터 구분 예시이미지 2D Grayscale ○ 라벨링 데이터
라벨링 데이터 목적 데이터 형식 홍삼 내부품질 탐지 JPG(2D Gray scale) + JSON (어노테이션 정보) ○ 데이터 포맷
데이터 포맷 구분 획득(수집) 단계 정제 단계 가공(라벨링) 단계 데이터 구분 원시데이터 원천데이터 최종데이터 데이터 형태 디지털 파일 → 디지털 파일 디지털 파일 → 디지털 파일 디지털 파일 형태로 산출 데이터 포맷 이미지 : JPG
(2,352×2,944 2D Gray scaIe)이미지 : JPG
(2,352×2,944 2D Gray scaIe)이미지 : JPG(2,352×2,944 2D Gray scaIe)
가공데이터: JSON 형태
○ 라벨링 데이터 구성라벨링 데이터 구성 No 속성명 항목 설명 Type 필수여부 범위 또는 작성예시 1. info-기본 정보 1-1 description 데이터셋 이름 string Y redginseng_grade 1-2 url 데이터셋 제작자 url string Y www.camtic.or.kr 1-3 version 제작버전 string Y v.1.0 1-4 year 제작년도 number Y 2022 1-5 type 데이터셋 타입 string Y jpg 1-6 img_path 이미지데이터 폴더 경로 string Y /redginseng/IMG/yyyyMMdd 1-7 label_path 라벨링데이터 폴더 경로 string Y /redginseng/JSON 2. collection - 수집 정보 2-1 device_name 장비명 string Y VEGARAY_CL 2-2 device_attribute 장비 속성 string Y Xray 2-3 device_Image_sensor_type 이미지 센서 타입 string Y CMOS Photodiode Array 2-4 device_focal_spot 초점거리(mm) number Y 0.15 2-5 device_exposure_time X선 노출시간(초) number Y 0.1~4.0 2-6 img_pixel_size 픽셀 사이즈(mm) number Y 0.0714 2-7 img_transformation_matrix 변환 매트릭스 string Y 예) [0.9877, 0.0093, 0.0000;
-0.0035, 0.9888, 0.0000;
0.0000, 0.0000, 1.0000]2-8 img_date 촬영일시 string Y yyyyMMdd 2-9 Ginseng_variety 인삼 품종 string Y 예) 천풍 2-10 Red_ginseng_position 홍삼 제조시설 위치 string Y 예) 전북 진안군 진안읍 3. licenses – 저작권 정보 3-1 licenses_id 라이센스 고유번호 number Y 1 3-2 licenses_name 라이센스 이름 string Y ginsengxray 4. images – 이미지 데이터 정보 4-1 img_file_name 원천데이터 이름(파일명) string Y 예) 20220708_Xray_000001 4-2 img_height 세로 number Y 1080 4-3 img_width 가로 number Y 1960 5. annotations – 어노테이션 정보 5-1 bbox bounding box 정보 string Y 예) [0.0, 0.0, 20.0, 23.0] 5-2 red_ginseng_width 홍삼 최대폭(mm) number Y 예) 15 5-3 red_ginseng_length 홍삼 장축길이(mm) number Y 예) 1200 5-4 inner_hole_discrimination 내공 유무 string Y [유, 무] 5-5 inner_hole_width 내공 최대폭(mm) number 예) 8 5-6 inner_hole_length 내공 최대길이(mm) number 예) 10 5-7 inside_whites_discrimination 내백 유무 string Y [유, 무] 5-8 inside_whites_width 내백 최대폭(mm) number 예) 8 5-9 inside_whites_length 내백 최대길이(mm) number 예) 8 5-10 classification 내부 품질 등급 string Y [상, 중, 하, 최하 ] ○ 라벨링 데이터 예시
-
데이터셋 구축 담당자
수행기관(주관) : (사)캠틱종합기술원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 황제현 063-219-0353 [email protected] 과제 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 전라북도 데이터 수집 관련 대외협조 (재)진안홍삼연구소 데이터 수집업체 섭외, 진안홍삼 관련 자문 ㈜에스에스엘 데이터 가공, 학습 모델 개발 ㈜하이드로봇테크앤리서치 데이터 수집 및 정제 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 황제현 063-219-0353 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.