콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#주요 화훼류 # 품질등급 # 중결점 # 유통환경 # 인공지능 # 학습데이터

주요 화훼류 품질 데이터

주요 화훼류 품질 데이터 아이콘 이미지
  • 분야농축수산
  • 유형 텍스트 , 이미지
구축년도 : 2022 갱신년월 : 2023-11 조회수 : 5,017 다운로드 : 171 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-11-17 데이터 최종 개방
    1.0 2023-07-05 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-01-12 산출물 전체 공개

    소개

    주요 화훼류 품목 9종(장미, 국화, 백합, 거베라, 접목선인장, 심비디움, 호접란, 스킨답서스, 고무나무)에 대해 유통환경별(농가/유통센터/도소매점) 정상 및 중결점 이미지데이터와 유통환경모니터링데이터 수집을 통해 학습용 데이터 120만장 이상 구축

    구축목적

    화훼류 품질의 등급화 및 규격화를 위한 AI 학습용 데이터 구축
  • 1. 데이터 구축 규모
    1) 원천데이터

    1. 데이터 구축 규모 1) 원천데이터
    데이터별 품목 데이터 수량 데이터 규모
    정상 이미지 데이터 품목 9종 575,379장 약 95GB
    (품종 5종)
    중결점 이미지 데이터 품목 9종 916,062장 약 155GB
    (품종 5종)

     

    2) 라벨링(가공)데이터 

    1. 데이터 구축 규모 2) 라벨링(가공)데이터 
    데이터별 품목 데이터 수량 데이터 규모
    정상 이미지 데이터 품목 9종 575,379장 약 1.5GB
    (품종 5종)
    중결점 이미지 데이터 품목 9종 916,062장 약 2.5GB
    (품종 5종)

     

    3) 분류별 데이터 수량

    1. 데이터 구축 규모 3) 분류별 데이터 수량
    분류 세부 분류 파일 포멧 정상 이미지 중결점 이미지
    장미 헤라 .jpg / .json 14,862 24,759
    푸에고 .jpg / .json 18,762 24,750
    보보스 .jpg / .json 23,835 34,353
    자나 .jpg / .json 18,462 24,759
    햇살 .jpg / .json 19,533 24,759
    국화 신마 .jpg / .json 11,877 12,384
    백선 .jpg / .json 9,909 20,796
    포드 .jpg / .json 22,308 32,964
    금수 .jpg / .json 10,167 17,646
    백강 .jpg / .json 10,872 16,518
    거베라 폼포니 .jpg / .json 15,819 25,026
    피콜리니 .jpg / .json 14,892 24,891
    스파이더 .jpg / .json 14,856 25,458
    파스타 .jpg / .json 14,853 28,128
    미니거베라 .jpg / .json 14,883 24,798
    백합 시베리아 .jpg / .json 18,819 30,843
    사만다 - 0 0
    우리타워 .jpg / .json 18,102 24,762
    옐로우윈 - 0 0
    메듀사 - 0 0
    프리지아 쏠레이 - 0 0
    골드리치 - 0 0
    이본느 - 0 0
    써니골드 - 0 0
    점보화이트 - 0 0
    접목선인장 아홍 .jpg / .json 15,306 24,756
    아황 .jpg / .json 15,222 24,786
    아울 .jpg / .json 16,473 26,184
    불빛 .jpg / .json 15,615 25,377
    연빛 .jpg / .json 15,006 24,768
    심비디움 해피차펠 .jpg / .json 3,006 5,085
    샤넬 .jpg / .json 3,009 5,055
    플뢰르 .jpg / .json 3,354 5,673
    스완 .jpg / .json 3,102 5,319
    스프링파루 .jpg / .json 3,420 5,271
    호접란 만천홍 .jpg / .json 14,883 25,881
    플러선셋 .jpg / .json 15,408 25,029
    V3 .jpg / .json 14,895 24,882
    러블리엔젤 .jpg / .json 6,495 8,475
    펑보핑크딜라이트 .jpg / .json 5,340 8,253
    고무나무 인도 .jpg / .json 15,813 24,750
    뱅갈 .jpg / .json 14,853 26,286
    떡갈 .jpg / .json 15,792 24,771
    무늬벤자민 .jpg / .json 15,117 24,753
    벤자민 .jpg / .json 15,138 24,957
    스킨답서스 마블 .jpg / .json 15,171 25,572
    형광 .jpg / .json 15,000 26,148
    엔조이 .jpg / .json 15,393 24,936
    엔젤 .jpg / .json 13,938 26,748
    화이트마블퀸 .jpg / .json 15,819 24,753
    합계 575,379 916,062

     

    2. 데이터 분포 
    1) 유통환경(농가/유통센터/도소매점)별 분포

    2. 데이터 분포 1) 유통환경(농가/유통센터/도소매점)별 분포
    유통환경 지점(곳) 데이터 수량(장) 비율(%)
    농가 12 362,478 24.30%
    유통센터 3 567,135 38.02%
    도소매점 4 561,828 37.68%
    소계 19 1,491,441 100%

     

    2) 이미지 촬영 각도 분포

    2. 데이터 분포 2) 이미지 촬영 각도 분포
    촬영각도 비율(%)
    정면 33.33%
    측면 33.33%
    33.33%
    합계 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    [학습 모델 개요]
    ■ 총 42개 품종의 화훼 데이터를 통해 정상 및 중결점을 구분할 수 있는 모델을 개발
    ■ 정상 화훼 데이터를 통해 품질을 특상, 상, 중으로 분류하는 모델을 개발
    ■ 모델은 각 품종마다 중결점 판단 모델, 품질 구분 모델이 존재하여 총 84개의 모델이 존재함
    ■ 중결점 분류 및 품질 분류 모델을 2가지 모델 모두 ResNet18 알고리즘을 사용하여 학습
    ■ ResNet은 skip-connection을 도입하여 과적합 정도를 완화하며 더 깊은 레이어를 쌓을 수 있도록 한 대표적인 이미지 분류 모델
    ■ 학습 및 검증 코드 설명
      ◆ abnormal-test-all.py : 중결점이 존재하는 것에 대한 테스트 파일
      ◆ normal-test-All.py : 정상에 대한 테스트 파일
      ◆ 중결점분류모델학습.ipynb : 중결점분류 학습 코드
      ◆ 품질분류모델학습.ipynb : 품질분류모델 학습 코드

    중결점 분류 모델

    [그림 8] 중결점 분류 모델

    품질 분류 모델
    [그림 9] 품질 분류 모델

     

    [모델학습]
    ■ 3가지 각도로 촬영된 이미지를 각각 ResNet18 모델에 입력하여 특징 추출함
    ■ 추출된 특징과 품종코드를 입력하여 Fully-Connected layer를 통해 중결점 유무를 판단하고, 정상인 화훼 데이터에서는 품질을 분류함
    ■ train/valid/test 데이터 셋을 각각 8:1:1 비율로 구성하여 학습시켰음

     

    [서비스 활용 시나리오]
    ■ 구축한 모델은 사용자의 화훼 이미지를 통해 중결점 유무를 판단할 수 있음
    ■ 구축한 모델은 사용자의 화훼 이미지를 통해 품질 검증을 할 수 있음
    ■ 2가지 모델을 활용할 경우 화훼 유통 시장을 더욱 효율적으로 운영할 수 있음

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 정상 화훼류 데이터 품질 등급 분류 성능 Text Classification ResNet18 F1-Score 0.85 0.9716
    2 중결점 화훼류 데이터 유무 성능 Text Classification ResNet18 F1-Score 0.85 0.867699999999999

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 설명
     - 인공지능 학습을 위한 9품목 42종의 고품질의 화훼류 품질 등급 규격별 이미지 학습용 데이터셋 및 유통환경모니터링 데이터셋의 구축 및 AI 모델 학습과 응용서비스의 개발


    2. 원시데이터 구성
    1) 파일명 형식

    2. 원시데이터 구성 1) 파일명 형식 화훼류 이미지 예시 데이터
    구분 화훼류 이미지 예시 데이터
    품목 표준코드 P01 (장미)
    품종 표준코드 S01 (헤라)
    정상/중결점 구분 H01 (정상), H02 (중결점)
    품질등급 S (특), A (상), B (중)
    중결점 z1(중결점1), z2(중결점2), z3(중결점3), z4(중결점4), z5(중결점5)
    촬영 각도 0 (좌측), 1 (탑뷰), 2 (우측)
    각 품질지표 점수 1,2,3
    유통단계 F(농가), D(유통센터), R(도소매점)
    농가,유통센터, 도소매점 정보 F01, F02, … D01, D02 … R01, R02, R03, … 
    촬영자 코드 C01
    촬영 일시 2205251130(YYMMDDHHMM)
    수확일 2205251130(YYMMDDHHMM)
    입고일 2205251130(YYMMDDHHMM)
    시리얼번호 S00001
    파일 포맷 .JPG
    정상파일명 품목_품종_정상_등급_점수_촬영각도_유통단계_정보_촬영자코드_촬영일시_수확일_입고일_시리얼.JPG
    정상파일명(예) P01_S01_H01_S_322_0_F_F01_C01_2205251130_2205250230_2205251100_S00001.JPG
    중결점파일명 품목_품종_중결점_지표_촬영각도_유통단계_정보_촬영자코드_촬영일시_수확일_입고일_시리얼.JPG
    중결점파일명(예) P01_S01_H02_z1_2_F_F01_C01_2205251130_2205250230_2205251100_S00001.JPG

     

    2. 원시데이터 구성 1) 파일명 형식 유통환경 모니터링 예시 데이터
    구분 유통환경 모니터링 예시 데이터
    장비 번호(시리얼넘버) 2207IL0101 (예시)
    유통단계 F(농가), D(유통센터), R(소매점)
    농가,유통센터, 소매점 정보 F01, F02, … D01, D02 … R01, R02, R03, …
    수집 확인자 코드 G01
    수집기간 2205251130-2205302359(YYMMDDHHMM-YYMMDDHHMM)
    파일 포맷 .CSV
    파일명 2207IL0101_F_F01_2205251130-2205302359.CSV

     

    2) 이미지 품질등급 및 중결점 지표

    2. 원시데이터 구성 2) 이미지 품질등급 및 중결점 지표
    구분 품질 등급 기준 결정 지표 중결점 지표
    장미 초장, 화색, 개화정도(스탠다드), 꽃수(스프레이) 꽃목굽음, 상처, 시들음, 곰팡이, 잎 황화
    국화 초장, 화색, 개화정도 꽃목길이, 백수병, 잎시들음, 응해 피해, 잎 황화
    거베라 초장, 줄기굵기, 줄기 휘어짐 꽃목굽음, 줄기휘어짐, 충해, 줄기상처, 꽃잎의 상처 및 꽃잎떨어짐
    백합 초장, 개화정도, 꽃수 봉오리 상처, 병해충, 잎의 시듦, 잎상처, 줄기휨
    프리지아 초장, 개화정도, 꽃수 꽃잎시듦, 꽃떨어짐, 화서꺾임, 꽃띔현상, 줄기휨
    접목선인장 대목의 길이, 화색, 접수의 크기 비대칭, 꽃의 유무, 무름병, 곰팡이, 흑색반점
    심비디움 초장, 꽃수, 화색 반점, 파손, 시들음, 설판 색 변화, 소화 개화율
    호접란 꽃대의 수, 꽃 송이수, 꽃대의 길이 잎무름, 잎상처, 꽃받침기형, 일소장해, 꽃대꺽임
    고무나무 엽색(엽맥), 줄기형태, 균형미 반점, 위축, 시들음, 엽색 변화, 탈리
    스킨답서스 엽색, 분지발생정도, 경엽 형태 반점, 위축, 시들음, 엽색 변화, 탈리

     

     3) 이미지 데이터

    2. 원시데이터 구성 3) 이미지 데이터
    구분 설명 데이터 유형 예시
    화훼류 이미지 화훼류 정상 이미지 이미지 파일 정면
    화훼류 정상 이미지 정면
    탑뷰
    화훼류 정상 이미지 탑뷰
    우측면
    화훼류 정상 이미지 우측면
    화훼류 중결점 이미지 이미지 파일 정면
    화훼류 중결점 이미지 정면
    탑뷰
    화훼류 중결점 이미지 탑뷰
    우측면
    화훼류 중결점 이미지 우측면

     

     4) 유통환경 모니터링 데이터

    2. 원시데이터 구성 4) 유통환경 모니터링 데이터
    구분 설명 데이터 유형 예시
    유통환경 모니터링 데이터 온도 센서 데이터 텍스트, CSV {
        "Date": "2022-11-08 0:58",
        "PM1": 13,
        "PM2.5": 18,
        "PM10": 29,
        "Temperature": 6.8,
        "Humidity": 76.1,
        "Hcho": 0,
        "Noise": 42,
        "Co2": 544,
        "Co": 0,
        "VOC": 193
    }
    습도 센서 데이터
    이산화탄소 센서 데이터
    미세먼지(PM2.5, PM10) 센서 데이터

     

    3. 어노테이션 포맷

    3. 어노테이션 포맷
    구분 항목명 타입 필수여부 설명 범위 비고
    1 version String X 버전정보    
    2 shapes       라벨링정보  
      2-1 label String X 정상(S,A,B) 또는 중결점(z1~z33)    
      2-2 points String O 바운딩박스/폴리곤 좌표값 [[X1, Y1], [X2, Y2], [X3, Y3]...]  
      2-3 shape_type String O 바운딩박스    
    (rectangle)
    폴리곤(polygon)
    3 imagePath String O 이미지경로 및 파일명    
    4 imageData String X 이미지 데이터   null
    5 imageHeight number O 이미지 높이    
    6 imageWidth number O 이미지 폭    
    7 Bounding       화훼류정보  
      7-1 class String O 대분류(품목) P01~P10 10품목
    7-2 detail String O 세부분류(품종) S01~S05 5품종
    7-3 quality_status String O 정상 또는 중결점 이미지 정상(H01),  
    중결점(H02)
    7-4 grade String X 품질등급 S(특), A(상), B(중)  중결점인 경우 null
    7-5 damage String X 중결점범위 Z1~Z33 정상인 경우 null
    7-6 photo_direction String O 촬영각도 0(정면), 1(탑뷰), 2(우측)  
    7-7 place String O 수집장소 F01~60(농가), D01~60(유통센터),  
    R01~60(도소매점)
    7-8 photographer_code String O 촬영자코드 C01~60  
    7-9 photo_date String O 촬영일시 YYMMDDHHMM  
    7-10 serial_no String O 시리얼번호 S000001~S999999  
    7-11 file_format String O 파일포맷 JPG  
    8 Distribution       유통환경 모니터링데이터  
      8-1 Date String O 일자    
    8-2 PM1 number O 미세먼지PM1    
    8-3 PM2.5 number O 미세먼지PM2.5    
    8-4 PM10 number O 미세먼지PM10    
    8-5 Temperature number O 온도    
    8-6 Humidity number O 습도    
    8-7 Hcho number O 포름알데하이드    
    8-8 Noise number O 소음    
    8-9 Co2 number O 이산화탄소    
    8-10 Co number O 일산화탄소    
    8-11 VOC number O 휘발성유기화합물    

     

    4. 결과 예시

    4. 결과 예시
    주요 화훼류 라벨링 데이터 포맷 예시(P06_S01_H02_z1_2_F06_C01_2208151226_220000_220000_S300030.json)
     {
    "version": "5.0.1",
    "shapes": [
    {
    "label": "Z32",
    "points": [
    [
    816.8571428571429,
    517.4081632653061
    ],
    [
    776.0408163265306,
    407.2040816326531
    ],
    [
    806.6530612244898,
    350.0612244897959
    ],
    [
    737.265306122449,
    284.7551020408163
    ],
    ....
    [
    549.5102040816327,
    1009.2448979591837
    ],
    [
    669.9183673469388,
    966.3877551020408
    ],
    [
    696.4489795918367,
    799.0408163265306
    ],
    [
    761.7551020408164,
    684.7551020408164
    ],
    [
    818.8979591836735,
    664.3469387755102
    ]
    ],
    "group_id": null,
    "shape_type": "polygon"
    }
    ],
    "imagePath": "P09_S04_H02_z32_0_D01_C35_2211050751_221009_221010_S000110.jpg",
    "imageData": null,
    "imageHeight": 1920,
    "imageWidth": 1080,
    "Bounding": [
    {
    "class": "고무나무",
    "detail": "무늬벤자민",
    "quality_status": "중결점",
    "grade": "",
    "damage": "Z32",
    "photo_direction": "정면",
    "place": "유통센터",
    "photographer_code": "C35",
    "photo_date": "2211050751",
    "serial_no": "S000110",
    "file_format": "jpg"
    }
    ],
    "Distribution": [
    {
    "Date": "2022-11-05 7:51",
    "PM1": 4,
    "PM2.5": 5,
    "PM10": 8,
    "Temperature": 18.2,
    "Humidity": 39.0,
    "Hcho": 0,
    "Noise": 57,
    "Co2": 462,
    "Co": 0,
    "VOC": 532
    }
    ]
            }
  • 데이터셋 구축 담당자

    수행기관(주관) : 서경대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김호현 02-940-7414 [email protected] 수집, 정제(유통환경 모니터링 데이터)
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜뉴컨 정제, 검사
    ㈜엔지스 가공
    ㈜위즈아이 학습모델
    ㈜한국융합아이티 수집(이미지 데이터)
    한국자원경제연구소㈜ 수집(이미지 데이터)
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김호현 02-940-7414 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.