-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-04-30 데이터 개방(Beta Verison) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
이매패류(새조개, 바지락)의 개체수가 감소되고 있는 상황에서 스마트 양식을 위하여 육상 이매패류(새조개, 바지락) 배양장에서 안정적인 종자생산을 하고, 최적의 배양환경과 배양장 관리를 분석
구축목적
수산업 분야 인공지능 기술 도입을 위한 종자생산 환경 및 배양 관리 정보 등을 포함한 이매패류 종자생산(새조개, 바지락)데이터 구축s
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 센서 , 이미지 데이터 형식 JPG, CSV 데이터 출처 충남수산자원연구소 새조개/바지락 종자생산 수조 라벨링 유형 세그멘테이션 라벨링 형식 JSON, CSV 데이터 활용 서비스 해당 없음 데이터 구축년도/
데이터 구축량2022년/이미지데이터: 132,284건 / 센서데이터: 1,366,778건 / 수기데이터: 618건 -
[데이터 통계]
o 데이터 구축 규모
- 이미지데이터 : 132,284건 / 센서데이터: 1,366,778건 / 수기데이터: 618건데이터 구축 규모 데이터 종류 데이터 형태 데이터 유형 구축 목표 어노테이션 규모 결과물 규모 새조개 수정란 이미지 JPG 20,000건 21,419건 67,047건 유생 이미지 JPG 20,000건 21,152건 치패 이미지 JPG 20,000건 24,476건 센서 데이터 CSV 100건 681,071건 681,071건 수기 데이터 CSV 250건 297건 297건 바지락 수정란 이미지 JPG 20,000건 20,430건 65,237건 유생 이미지 JPG 20,000건 21,977건 치패 이미지 JPG 20,000건 22,830건 센서 데이터 CSV 107건 685,707건 685,707건 수기 데이터 CSV 250건 321건 321건 데이터 분포]
o 매체별 분포 : 이매패류 종류, 종자 성장, 시계열 데이터 건수
o 주제별 분포 : 바지락(수정란, 유생, 치패), 새조개(수정란, 유생, 치패)데이터 분포 구분 구축 건수 비율 이매패류 종류 분포 바지락 67,047건 50.68% 새조개 65,237건 49.32% 합계 132,284건 100% 구분 구축 건수 비율 종자 성장 분포 수정란 41,849건 31.64% 유생 43,129건 32.60% 치패 47,306건 35.76% 합계 132,284건 100% 데이터 분포 구분 구축 건수 비율 시계열 데이터 건수 바지락 수정란 5,760건 0.42% 바지락 유생 81,328건 5.95% 바지락 치패 598,726건 43.80% 새조개 수정란 13,500건 0.99% 새조개 유생 79,341건 5.81% 새조개 치패 588,330건 43.03% 합계 1,366,985건 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드[활용 모델]
활용 모델 o 학습모델 [사진4] - U-Net : Image Segmentation 모델 중 FCN 기반 모델로 컬러 이미지에서 이매패류의 성장한 모습을 각 이미지에서 Segmentation 하는 모델 o 학습 데이터 - Image 데이터 : Json Label 데이터 = 1 : 1로 각각 132,284건 - Train : Validation : Test = 8 : 1 : 1 o 성능지표 - mIoU(mean Intersection over Union)로 Pascal VOC 2012 데이터셋 기준 75 이상 o 모델링 흐름도
- 새조개/바지락에 각각 적용된 모델이며, (U-Net input) 모델에 이미지를 넣게 되면 (객체 분할) 각 클래스에 맞는 객체와 아닌 객체로 분할 하여 (U-Net output) 최종적으로 오른쪽 위로 분할된 결과물을 원본 이미지에 합성해주어 어떤 객체인지 쉽게 구분할 수 있게 시각화
o AI 데이터 활용
- 3개의 클래스를 Json의 날짜 데이터를 활용하여 9개로 클래스로 확장하여 분류
- 종자 생산시 수조내의 생물들의 발달단계 비율 확인 및 정상적인 발달 과정의 참고자료로 활용 가능[서비스 활용 시나리오]
종자 생산 시 관리자가 직접 현미경 이미지를 일일이 확인하는 과정 생략 가능 모델을 활용한 24시간 관측의 자동화
- 스마트 양식에서 먹이와 수온 등의 관리사항을 발달 정도에 따라 최적화 가능
- 현미경 데이터를 수집하는 시스템을 구축하고 AI가 자동으로 분석을 하여 양식업 종사자 및 전문 연구원에게 다양한 분석
정보를 제공
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 새조개 종자탐지 성능 Object Detection Unet mIoU 75 % 99.55 % 2 바지락 종잠탐지 성능 Object Detection Unet mIoU 75 % 99.54 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드[데이터 구성]
데이터 구성 NO Field name Meaning 1 바지락 바지락의 수정란, 유생, 치패 카테고리별 생장 이미지 2 새조개 새조개의 수정란, 유생, 치패 카테고리별 생장 이미지 3 센서데이터 바지락, 새조개 각 수조에 대한 센서데이터 4 수기데이터 바지락, 새조개 생장 일별 수기 데이터 [어노테이션 포맷]
어노테이션 포맷 구분 속성명 타입 필수 여부 설명 예시 1 info array Y 데이터 정보 1-1 description string Y 데이터 설명 "cerastoderma" 1-2 creator string Y 데이터 생성자 "세명소프트" 1-3 distributor string Y 데이터 공급자 "세명소프트" 1-4 region_name string Y 데이터 수급자 "충남수산자원연구소" 2 categories array Y 분류 카테고리 2-1 id number Y 카테고리 아이디 1,2,3,4 2-2 name string Y 중분류 "새조개_수정란" 2-3 supercategory string Y 대분류 "새조개","바지락" 3 object_info object Y 객체 정보 3-1 shoot_info object 촬영 정보 1 classification string Y 객체 분류 클래스 "수정란", "유생", "유생폐사", "치패" 2 equipment_name string Y 촬영 장비 "고배율 광학현미경", "저배율 실체현미경", "디지털 카메라" 3 file_name string Y 이미지 파일명 "FU_MG_220702" 4 b_date string Y 출생일 "2022-07-01" 5 s_date string Y 입식일 "2022-07-02" 6 m_date string Y 수조이동일 "2022-07-02" 7 f_date string Y 촬영일 "2022-07-02" 8 region_name string Y 촬영 장소 "충남수산자원연구소" 9 magnification string Y 배율 400 10 pixel_constant string 상수 11 a_time string 생존시간 3-2 manage_info object 수기데이터 1 water_tank string Y 수조명 "A1-02" 2 a_day string Y 태어난일수 “1” 3 tank_size string Y 물탱크용량 “10” 4 mean_shell_length string Y 평균 쉘 길이 “80” 3-3 water_info object 수처리 정보 1 replaced_water string Y 환수 "Y", "N" 2 filter string Y 필터 "Y", "N" 3 UV string Y UV "Y", "N" 4 EDTA string Y EDTA "Y", "N" 5 antibiotic string Y 항생제 "Y", "N" 3-4 feed_info object 먹이공급 정보 1 Iso_cells string 먹이정보 cells/ul “680” 2 Chaeto_cells string 먹이정보 cells/ul 3 Tet_cells string 먹이정보 cells/ul 4 Iso_fed string 먹이정보 fed/tank(L) “1” 5 Chaeto_fed string 먹이정보 fed/tank(L) 6 Tet_fed string 먹이정보 fed/tank(L) 3-5 observe_info object 객체 관찰 정보 1 color string 객체 색상 “Good” 2 vitality string 객체 활력 "Y", "N" 3 sample_liter string 시료량 (L) “0.01” 4 count string 계수 “15,25,16” 5 object_density string 유생밀도(ind./ml) “2” 6 object_amount string 유생총량 (ind./10톤) “18,666,667“ 4 images array 이미지 정보 4-1 id number Y 이미지 아이디 8883 4-2 file_name string Y 이미지 파일명 "FU_MS_400_LA_220702_1730_001 (1).jpg" 4-3 sensor_info object Y 센서데이터 1 water_temp string Y 수온 “23” 2 salinity string Y 수소이온농도 “30.78” 3 DO string Y 용존산소량 “6.28” 4 pH string Y 염분 “7.77” 4-4 width number Y 이미지 가로길이 960 4-5 height number Y 이미지 높이길이 608 5 annotations array Y 라벨링 정보 5-1 id number Y 아이디 18120 5-2 image_id number Y 이미지 아이디 8883 5-3 category_id number Y 카테고리 아이디 2 5-4 segmentation array Y 라벨링 데이터 좌표 771.7,381.9,.. 5-5 area number Y 라벨링 면적 30007 5-6 bbox array Y 객체 바운더리 정보 621.5,372.7,200.5,203.4 5-7 iscrowd number Y 라벨링 데이터 중첩 여부 0 5-8 attributes object Y 속성 1 occluded boolean Y 속성 존재유무 FALSE 5-9 shell_size number Y 객체 길이 95.20758779 [데이터 포맷]
데이터 포맷 구분 예시 데이터 항목 이미지 데이터 [사진1]
수정란 [사진2]
유생 [사진3]
치패 센서 데이터 파일명(name) FU_WQ_220701 새조개 날짜 및 시간(dateTime) 2022-07-01 14:30 온도(Temp) 22.5 산소포화도(pH) 8.01 바지락 용존산소량(DO) 5.55 염도(SAL) 30.52 수기 데이터 MA_MG_220707_F 먹이공급 새조개 유생관찰 MA_MG_220707_S 기본정보 수기데이터 바지락 MA_MG_220707_W 수질측정 수처리 [JSON 형식]
JSON 형식 json 포맷 구축 형태 {
"info": {
{
"description": "cerastoderma",
"creator": "세명소프트",
"distributor": "세명소프트",
"region_name": "충남수산자원연구소"
}
},
"categories": {
{
"id": 1,
"name": "새조개_수정란",
"supercategory": "새조개"
},
{
"id": 2,
"name": "새조개_유생",
"supercategory": "새조개"
},
{
"id": 3,
"name": "새조개_유생폐사",
"supercategory": "새조개"
},
{
"id": 4,
"name": "새조개_치패",
"supercategory": "새조개"
}
},
"object_info": {
"shoot_info": {
"classification": "유생",
"equipment_name": "고배율 광학현미경",
"file_name": "FU_MG_220702",
"b_date": "2022-07-01",
"s_date": "2022-07-02",
"m_date": "2022-07-02",
"f_date": "2022-07-02",
"region_name": "충남수산자원연구소",
"magnification": "400",
"pixel_constant": "",
"a_time": ""
},
"manage_info": {
"water_tank": "A1-02",
"a_day": "1",
"tank_size": "10",
"mean_shell_length": "80"
},
"water_info": {
"replaced_water": "Y",
"filter": "Y",
"UV": "Y",
"EDTA": "N",
"antibiotic": "N"
},"feed_info": {
"Iso_cells": "680",
"Chaeto_cells": "",
"Tet_cells": "",
"Iso_fed": "1",
"Chaeto_fed": "",
"Tet_fed": ""
},
"observe_info": {
"color": "Good",
"vitality": "Y",
"sample_liter": "0.01",
"count": "15,25,16",
"object_density": "2",
"object_amount": " 18,666,667 "
}
],"images": {
{
"id": 8883,
"file_name": "FU_MS_400_LA_220702_1730_001 (1).jpg",
"sensor_info": {
"water_temp": "23",
"salinity": "30.78",
"DO": "6.28 ",
"pH": "7.77"
},
"width": 960,
"height": 608
}
},
"annotations": {
{
"id": 18120,
"image_id": 8883,
"category_id": 2,
"segmentation": {
{
771.7,
381.9,
...
386.8
}
},
"area": 30007.0,
"bbox": {
621.5,
372.7,
200.5,
203.4
},
"iscrowd": 0,
"attributes": {
"occluded": false
},
"shell_size": 95.20758779201734
}
}
} -
데이터셋 구축 담당자
수행기관(주관) : 충남수산자원연구소
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 남기웅 연구사 041-635-7773 [email protected] 수집 수행기관(참여)
수행기관(참여) 기관명 담당업무 세명소프트 정제/가공 타임게이트 품질관리 티맥스인공지능개발센터 모델링 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 남기웅 연구사 041-635-7773 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.