콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#이매패류 # 종자생산 # 스마트양식 # 수산산업지능화 #수산업

이매패류(새조개, 바지락) 종자생산 데이터

이매패류(새조개, 바지락) 종자생산 데이터 아이콘 이미지
  • 분야농축수산
  • 유형 센서 , 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 14,787 다운로드 : 65 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-15 데이터 최종 개방
    1.0 2023-04-30 데이터 개방(Beta Verison)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-15 산출물 전체 공개

    소개

    이매패류(새조개, 바지락)의 개체수가 감소되고 있는 상황에서 스마트 양식을 위하여 육상 이매패류(새조개, 바지락) 배양장에서 안정적인 종자생산을 하고, 최적의 배양환경과 배양장 관리를 분석

    구축목적

    수산업 분야 인공지능 기술 도입을 위한 종자생산 환경 및 배양 관리 정보 등을 포함한 이매패류 종자생산(새조개, 바지락)데이터 구축s
  • [데이터 통계]
     o 데이터 구축 규모
      - 이미지데이터 : 132,284건 / 센서데이터: 1,366,778건 / 수기데이터: 618건

     
    데이터 구축 규모
    데이터 종류 데이터 형태 데이터 유형 구축 목표 어노테이션 규모 결과물 규모
    새조개 수정란 이미지 JPG 20,000건 21,419건 67,047건
    유생 이미지 JPG 20,000건 21,152건
    치패 이미지 JPG 20,000건 24,476건
    센서 데이터 CSV 100건 681,071건 681,071건
    수기 데이터 CSV 250건 297건 297건
    바지락 수정란 이미지 JPG 20,000건 20,430건 65,237건
    유생 이미지 JPG 20,000건 21,977건
    치패 이미지 JPG 20,000건 22,830건
    센서 데이터 CSV 107건 685,707건 685,707건
    수기 데이터 CSV 250건 321건 321건
     

    데이터 분포]
     o 매체별 분포 : 이매패류 종류, 종자 성장, 시계열 데이터 건수
     o 주제별 분포 : 바지락(수정란, 유생, 치패), 새조개(수정란, 유생, 치패)

     
     
    데이터 분포
    구분 구축 건수 비율
    이매패류 종류 분포 바지락 67,047건 50.68%
    새조개 65,237건 49.32%
    합계 132,284건 100%
     
    구분 구축 건수 비율
    종자 성장 분포 수정란 41,849건 31.64%
    유생 43,129건 32.60%
    치패 47,306건 35.76%
    합계 132,284건 100%
     
     
     
    데이터 분포
    구분 구축 건수 비율
    시계열 데이터 건수  바지락 수정란 5,760건 0.42%
    바지락 유생 81,328건 5.95%
    바지락 치패 598,726건 43.80%
    새조개 수정란 13,500건 0.99%
    새조개 유생 79,341건 5.81%
    새조개 치패 588,330건 43.03%
    합계 1,366,985건 100%

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    [활용 모델]

     
    활용 모델
    o 학습모델 [사진4]
    - U-Net : Image Segmentation 모델 중 FCN 기반 모델로 컬러 이미지에서 이매패류의 성장한 모습을 각 이미지에서 Segmentation 하는 모델 
    o 학습 데이터
    - Image 데이터 : Json Label 데이터 = 1 : 1로 각각 132,284건
    - Train : Validation : Test = 8 : 1 : 1
    o 성능지표 
    - mIoU(mean Intersection over Union)로 Pascal VOC 2012 데이터셋 기준 75 이상
     

    o 모델링 흐름도

     - 새조개/바지락에 각각 적용된 모델이며, (U-Net input) 모델에 이미지를 넣게 되면 (객체 분할) 각 클래스에 맞는 객체와 아닌 객체로 분할 하여 (U-Net output) 최종적으로 오른쪽 위로 분할된 결과물을 원본 이미지에 합성해주어 어떤 객체인지 쉽게 구분할 수 있게 시각화

     

     o AI 데이터 활용

    - 3개의 클래스를 Json의 날짜 데이터를 활용하여 9개로 클래스로 확장하여 분류
    - 종자 생산시 수조내의 생물들의 발달단계 비율 확인 및 정상적인 발달 과정의 참고자료로 활용 가능

    [서비스 활용 시나리오]

    수집 현미경 데이터를수집하는 시스템 분석 자동분석(개체 분류, 세그먼테이션 이미지)등을 DB저장 및 시각화 서비스 양식 종사자에게는 알림 전문 연구원에게는 다양한 분석 정보제공

     종자 생산 시 관리자가 직접 현미경 이미지를 일일이 확인하는 과정 생략 가능 모델을 활용한 24시간 관측의 자동화
    - 스마트 양식에서 먹이와 수온 등의 관리사항을 발달 정도에 따라 최적화 가능
    - 현미경 데이터를 수집하는 시스템을 구축하고 AI가 자동으로 분석을 하여 양식업 종사자 및 전문 연구원에게 다양한 분석 
      정보를 제공


     

     

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 새조개 종자탐지 성능 Object Detection Unet mIoU 75 % 99.55 %
    2 바지락 종잠탐지 성능 Object Detection Unet mIoU 75 % 99.54 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    [데이터 구성]

    데이터 구성
    NO Field name Meaning
    1 바지락 바지락의 수정란, 유생, 치패 카테고리별 생장 이미지
    2 새조개 새조개의 수정란, 유생, 치패 카테고리별 생장 이미지
    3 센서데이터 바지락, 새조개 각 수조에 대한 센서데이터
    4 수기데이터 바지락, 새조개 생장 일별 수기 데이터

      

    [어노테이션 포맷] 

    어노테이션 포맷
    구분 속성명 타입 필수 여부 설명 예시
    1 info array Y 데이터 정보  
      1-1 description string Y 데이터 설명 "cerastoderma"
    1-2 creator string Y 데이터 생성자 "세명소프트"
    1-3 distributor string Y 데이터 공급자 "세명소프트"
    1-4 region_name string Y 데이터 수급자 "충남수산자원연구소"
    2 categories array Y 분류 카테고리  
        2-1 id number Y 카테고리 아이디 1,2,3,4
    2-2 name string Y 중분류 "새조개_수정란"
    2-3 supercategory string Y 대분류  "새조개","바지락"
    3 object_info object Y 객체 정보  
        3-1 shoot_info object   촬영 정보  
      1 classification string Y 객체 분류 클래스 "수정란", "유생", "유생폐사", "치패"
    2 equipment_name string Y 촬영 장비 "고배율 광학현미경", "저배율 실체현미경", "디지털 카메라"
    3 file_name string Y 이미지 파일명 "FU_MG_220702"
    4 b_date string Y 출생일 "2022-07-01"
    5 s_date string Y 입식일 "2022-07-02"
    6 m_date string Y 수조이동일 "2022-07-02"
    7 f_date string Y 촬영일 "2022-07-02"
    8 region_name string Y 촬영 장소  "충남수산자원연구소"
    9 magnification string Y 배율 400
    10 pixel_constant string   상수   
    11 a_time string   생존시간  
    3-2 manage_info object   수기데이터  
      1 water_tank string Y 수조명 "A1-02"
    2 a_day string Y 태어난일수 “1”
    3 tank_size string Y 물탱크용량 “10”
    4 mean_shell_length string Y 평균 쉘 길이 “80”
    3-3 water_info object   수처리 정보  
      1 replaced_water string Y 환수 "Y", "N"
    2 filter string Y 필터 "Y", "N"
    3 UV string Y UV "Y", "N"
    4 EDTA string Y EDTA "Y", "N"
    5 antibiotic string Y 항생제 "Y", "N"
    3-4 feed_info object   먹이공급 정보  
      1 Iso_cells string   먹이정보 cells/ul “680”
    2 Chaeto_cells string   먹이정보 cells/ul  
    3 Tet_cells string   먹이정보 cells/ul  
    4 Iso_fed string   먹이정보 fed/tank(L) “1”
    5 Chaeto_fed string   먹이정보 fed/tank(L)  
    6 Tet_fed string   먹이정보 fed/tank(L)  
    3-5 observe_info object   객체 관찰 정보  
      1 color string   객체 색상 “Good”
    2 vitality string   객체 활력 "Y", "N"
    3 sample_liter string   시료량 (L) “0.01”
    4 count string   계수 “15,25,16”
    5 object_density string   유생밀도(ind./ml) “2”
    6 object_amount string   유생총량 (ind./10톤) “18,666,667“ 
    4 images array   이미지 정보  
        4-1 id number Y 이미지 아이디 8883
    4-2 file_name string Y 이미지 파일명 "FU_MS_400_LA_220702_1730_001 (1).jpg"
    4-3 sensor_info object Y 센서데이터  
      1 water_temp string Y 수온 “23”
    2 salinity string Y 수소이온농도 “30.78”
    3 DO string Y 용존산소량 “6.28”
    4 pH string Y 염분 “7.77”
    4-4 width number Y 이미지 가로길이 960
    4-5 height number Y 이미지 높이길이 608
    5 annotations array Y 라벨링 정보  
        5-1 id number Y 아이디 18120
        5-2 image_id number Y 이미지 아이디 8883
        5-3 category_id number Y 카테고리 아이디 2
        5-4 segmentation array Y 라벨링 데이터 좌표  771.7,381.9,..
        5-5 area number Y 라벨링 면적 30007
        5-6 bbox array Y 객체 바운더리 정보 621.5,372.7,200.5,203.4
        5-7 iscrowd number Y 라벨링 데이터 중첩 여부  0
        5-8 attributes object Y 속성  
          1 occluded boolean Y 속성 존재유무 FALSE
        5-9 shell_size number Y 객체 길이 95.20758779

     

    [데이터 포맷]

    데이터 포맷
    구분 예시 데이터 항목
    이미지 데이터

    수정란 확대 이미지 [사진1]

    수정란

    유생 확대 이미지 [사진2]

    유생

    치패 확대 이미지 [사진3]

    치패
    센서 데이터 파일명(name) FU_WQ_220701 새조개
    날짜 및 시간(dateTime) 2022-07-01 14:30
    온도(Temp) 22.5
    산소포화도(pH) 8.01 바지락
    용존산소량(DO) 5.55
    염도(SAL) 30.52
    수기 데이터 MA_MG_220707_F 먹이공급 새조개
    유생관찰
    MA_MG_220707_S 기본정보
    수기데이터 바지락
    MA_MG_220707_W 수질측정
    수처리

     

    [JSON 형식]

     
    JSON 형식
    json 포맷 구축 형태
    {
        "info": {
            {
                "description": "cerastoderma",
                "creator": "세명소프트",
                "distributor": "세명소프트",
                "region_name": "충남수산자원연구소"
            }
        },
        "categories": {
            {
                "id": 1,
                "name": "새조개_수정란",
                "supercategory": "새조개"
            },
            {
                "id": 2,
                "name": "새조개_유생",
                "supercategory": "새조개"
            },
            {
                "id": 3,
                "name": "새조개_유생폐사",
                "supercategory": "새조개"
            },
            {
                "id": 4,
                "name": "새조개_치패",
                "supercategory": "새조개"
            }
        },
        "object_info": {
                    "shoot_info": {
                    "classification": "유생",
                    "equipment_name": "고배율 광학현미경",
                    "file_name": "FU_MG_220702",
                    "b_date": "2022-07-01",
                    "s_date": "2022-07-02",
                    "m_date": "2022-07-02",
                    "f_date": "2022-07-02",
                    "region_name": "충남수산자원연구소",
                    "magnification": "400",
                    "pixel_constant": "",
                    "a_time": ""
             },
                    "manage_info": {
                    "water_tank": "A1-02",
                    "a_day": "1",
                    "tank_size": "10",
                    "mean_shell_length": "80"
            },
                    "water_info": {
                    "replaced_water": "Y",
                    "filter": "Y",
                    "UV": "Y",
                    "EDTA": "N",
                    "antibiotic": "N"
            },

             "feed_info": {
                    "Iso_cells": "680",
                    "Chaeto_cells": "",
                    "Tet_cells": "",
                    "Iso_fed": "1",
                    "Chaeto_fed": "",
                    "Tet_fed": ""
            },
                "observe_info": {
                    "color": "Good",
                    "vitality": "Y",
                    "sample_liter": "0.01",
                    "count": "15,25,16",
                    "object_density": "2",
                    "object_amount": " 18,666,667 "
            }
        ],

        "images": {
            {
                "id": 8883,
                "file_name": "FU_MS_400_LA_220702_1730_001 (1).jpg",
                "sensor_info": {
                    "water_temp": "23",
                    "salinity": "30.78",
                    "DO": "6.28 ",
                    "pH": "7.77"
                },
                "width": 960,
                "height": 608
            }
        },
        "annotations": {
            {
                "id": 18120,
                "image_id": 8883,
                "category_id": 2,
                "segmentation": {
                    {
                        771.7,
                        381.9,
                        ...
                        386.8
                    }
                },
                "area": 30007.0,
                "bbox": {
                    621.5,
                    372.7,
                    200.5,
                    203.4
                },
                "iscrowd": 0,
                "attributes": {
                    "occluded": false
                },
                "shell_size": 95.20758779201734
            }
        }
    }

     

  • 데이터셋 구축 담당자

    수행기관(주관) : 충남수산자원연구소
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    남기웅 연구사 041-635-7773 [email protected] 수집
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    세명소프트 정제/가공
    타임게이트 품질관리
    티맥스인공지능개발센터 모델링
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    남기웅 연구사 041-635-7773 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.