-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-04-26 구축 가이드 파일 등록 2022-10-20 신규 샘플데이터 개방 2022-07-29 콘텐츠 최초 등록 소개
1. 먹이생물 – 인공종묘(굴)의 먹이생물(플랑크톤)에 대한 배양환경(온도,DO,pH,염도,탁도) – 배양데이터 (먹이생물 수) 2. 인공종묘 (굴) – 유생기(실내) : 배양환경(온도,DO,pH,염도,먹이급이량) 및 생육환경 (성장/폐사) – 부착기(실내) : 배양환경(온도, 먹이급이량) 및 생육환경 (성장) – 가이식기(바다) : 환경(유효플랑크톤, 리터당 엽록소 수), 생육환경 (성장) – 본이식기(바다) : 환경(유효플랑크톤, 리터당 엽록소 수), 생육환경 (성장)
구축목적
패류 인공종묘사업의 근간이 되는 먹이생물(플랑크톤) 대량배양/관리 학습데이터 구축으로 패류 인공종묘생산 산업의 기반 강화
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 JPG / CSV 데이터 출처 자체수집 라벨링 유형 바운딩박스 / 키포인트 라벨링 형식 JSON, CSV 데이터 활용 서비스 최적화된 먹이생물(플랑크톤) 급이 학습데이터 구축을 통한 패류 건강 인공종묘 생산기법 개발로 안정적인 종묘공급기반 구축 데이터 구축년도/
데이터 구축량2021년/먹이생물(622,702) / 인공종묘(1,953,745) -
1. 데이터 구축 규모
1. 데이터 구축 규모 데이터
구분생육
단계정보
구분정보내용 유형 목표수량
(건)실적수량
(건)먹이생물 먹이배양 환경 수질 온도 CSV 444,790 1,558,480 DO pH 염도 탁도 생육 먹이생물 수 배양 JPG 177,912 311,696 JSON - 311,696 CSV - 311,696 소계 622,702 2,493,568 인공종묘
생육정보
(굴)유생기 환경 수질 온도 CSV 397,900 628,992 DO pH 염도 먹이급이량 L CSV 3,544 944 생육 성장/폐사 성장 JPG 16,295 53,273 폐사 518 성장 JSON - 53,273 성장 CSV 326,085 1,361,604 (각장/각고/중량) 폐사 11,894 (각장/중량) 행동패턴 이동거리 JPG 491,206 11,868 JSON 11,868 CSV 617,483 부착기 환경 수질 온도 CSV 8,756 25,200 먹이급이량 L CSV 274 140 생육 성장 건 JPG 1,459 2,714 각장/각고/중량 CSV 29,189 43,851 가이식 환경 유효플랑크톤 분포 JPG 885 599 JSON 599 엽록소 수 /플랑크톤수 CSV 885 1,198 생육 성장 장 JPG 885 996 각장 CSV 2,655 15,843 각고 중량 본이식 환경 유효플랑크톤 분포 JPG 13,017 7,482 JSON 7,482 엽록소 수 /플랑크톤수 CSV 10,008 14,964 생육 성장 장 JPG 7,000 7,250 각장 CSV 21,000 21,750 각고 중량 소계 1,331,043 2,901,785 합계 1,953,745 5,395,353 2. 데이터 분포
2. 데이터 분포 구분 정보 분포 먹이생물 실내 배양 환경 28.89% 46.22% 생육 17.33% 인공종묘 실내 유생기 환경 11.68% 52.33% 생육 39.33% 부착기 환경 0.47% 생육 0.86% 바다 가이식 환경 0.04% 1.45% 생육 0.31% 본이식 환경 0.55% 생육 0.54% 합계 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 패류 인공종묘사업의 근간이 되는 먹이생물(플랑크톤) 대량배양 학습데이터 구축으로 패류 인공종묘생산 산업의 기반 강화
- 최적화된 먹이생물(플랑크톤) 급이 학습데이터 구축을 통한 패류 건강 인공종묘 생산 기법 개발로 안정적인 종묘공급기반 구축
- 사육중인 유생의 대량폐사 학습데이터 구축을 통한 원인 구명으로, 초기 부착패류의 생존율 개선을 위한 물리/화학적 조건 도출
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 인공종묘 성장지수 분류 예측(유생기) Classification LightGBM F1-Score 0.75 점 0.84 점 2 먹이생물 밀도 예측 Estimation XGBoost SMAPE 15 % 14.09 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
구축활용가이드 다운로드1. 이미지/CSV 데이터 예시
1. 이미지/CSV 데이터 예시 데이터 방식 설명 예시 포맷 먹이생물 원천데이터 먹이생물 배양액 촬영 이미지 JPG 키포인트 라벨링 먹이생물 수를 측정한 라벨데이터 JSON CSV 가공 수질+먹이생물수 CSV 유생기 성장 원천데이터 유생 성장 촬영한
이미지 데이터JPG 사각형 라벨링 유생의 크기를 측정하기 위한 박스를 그려놓은 라벨 데이터 JSON CSV 가공 각장,각고,중량 데이터 산출 CSV 유생 행동패턴
(이동거리)원천데이터 유생움직임 이미지
(1/30초 저속촬영)JPG 사각형 라벨링 유생의 이동거리(궤적)를 측정한 라벨 데이터 JSON CSV 가공 초당 이동거리 산출 CSV 부착기 / 가이식기 성장 원천데이터 성장
현미경 측정 데이터JPG CSV 가공 각장,각고,중량 데이터 산출 CSV 가이식 / 본이식
유효플랑크톤원천데이터 유효플랑크톤 이미지 (바다) JPG 리터당 엽록소 수 CSV 키포인트 라벨링 유효플랑크톤 수를 측정한 라벨데이터 CSV 본이식 성장 원천데이터 굴의 성장 촬영
이미지 데이터
(각장.각고,중량 추출)JPG CSV 가공 각장, 각고, 중량 계측 CSV 수조 정보 CSV 수조별로 온도, 염도, 탁도 등의 정보를 기록한 정형 데이터 CSV 2. 라벨링데이터 구성
- 라벨링 데이터 정보
2. 라벨링데이터 구성 라벨링 데이터 정보 No. 어노테이션 형태 항목 설명 1 공통 속성 info.name 데이터셋명 2 info.description 데이터셋 상세 설명 3 info.url 데이터셋 URL 4 info.date_created 데이터셋 생성일자 5 images[].id 이미지 식별자 6 images[].width 이미지 너비 7 images[].height 이미지 높이 8 images[].file_name 이미지 파일명 9 images[].license 이미지 라이선스 10 images[].date_created 이미지 촬영일자 11 사각형 속성 annotations[].id 라벨링 식별자 12 annotations[].image_id 연관이미지 식별자 13 annotations[].categoy_id 클래스 정보 14 annotations[].category_name 라벨링 텍스트 15 annotations[].attributes 라벨링 속성 16 annotations[].bbox[].x 시작점의 X 좌표 17 annotations[].bbox[].y 시작점의 Y 좌표 18 annotations[].bbox[].width 너비 19 annotations[].bbox[].height 높이 20 annotations[].bbox[].type 폭/길이 구분 21 annotations[].bbox[].no 유생번호 22 licenses[].name 라이선스명 23 licenses[].url 라이선스 URL 24 키포인트 속성 annotations[].id 라벨링 식별자 25 annotations[].image_id 연관이미지 식별자 26 annotations[].category_id 클래스 정보 27 annotations[].category_name 라벨링 텍스트 28 annotations[].attributes 라벨링 속성 29 annotations[].keypoints[].x X 좌표 30 annotations[].keypoints[].y Y 좌표 31 licneses[].name 라이선스명 32 licneses[].url 라이선스 URL - 공통 라벨링 데이터셋 속성 정의
2. 라벨링데이터 구성 공통 라벨링 데이터셋 속성 정의 No. 속성명 항목 설명 타입 1 info 데이터셋 정보 Object 1–1 info.name 데이터셋명 String 1–2 info.description 데이터셋 상세 설명 String 1–3 info.url 데이터셋 URL String 1–4 info.date_created 데이터셋 생성일자 String 2 images[] 이미지 정보 Object 2–1 images[].id 이미지 식별자 String 2–2 images[].width 이미지 너비 Number 2–3 images[].height 이미지 높이 Number 2–4 images[].file_name 이미지 파일명 String 2–5 images[].license 이미지 라이선스 String 2–6 images[].date_created 이미지 촬영일자 String - 사각형 라벨링 데이터셋 속성 정의
2. 라벨링데이터 구성 사각형 라벨링 데이터셋 속성 정의 No. 속성명 항목 설명 타입 3 annotations[] 라벨링 정보 Object 3–1 annotations[].id 라벨링 식별자 String 3–2 annotations[].image_id 연관이미지 식별자 String 3–3 annotations[].categoy_id 클래스 정보 int 3–4 annotations[].category_name 라벨링 텍스트 String 3–5 annotations[].attributes 라벨링 속성 Object 3–6 annotations[].bbox[] 바운딩박스 라벨 List 3–6–1 annotations[].bbox[].x 시작점의 X 좌표 Number 3–6–2 annotations[].bbox[].y 시작점의 Y 좌표 Number 3–6–3 annotations[].bbox[].width 너비 Number 3–6–4 annotations[].bbox[].height 높이 Number 3–6–5 annotations[].bbox[].type 폭/길이 구분 String 3–6–6 annotations[].bbox[].no 유생번호 String 4 licenses[] 라이선스 Object 4–1 licenses[].name 라이선스명 String 4–2 licenses[].url 라이선스 URL String - 키포인트 라벨링 데이터셋 속성 정의
2. 라벨링데이터 구성 키포인트 라벨링 데이터셋 속성 정의 No. 속성명 항목 설명 타입 3 annotations[] 라벨링 정보 Object 3–1 annotations[].id 라벨링 식별자 String 3–2 annotations[].image_id 연관이미지 식별자 String 3–3 annotations[].category_id 클래스 정보 int 3–4 annotations[].category_name 라벨링 텍스트 String 3–5 annotations[].attributes 라벨링 속성 Object 3–6 annotations[].keypoints[] 키포인트 라벨 List 3–6–1 annotations[].keypoints[].x X 좌표 Number 3–6–2 annotations[].keypoints[].y Y 좌표 Number 4 licneses[] 라이선스 Object 4–1 licneses[].name 라이선스명 String 4–2 licneses[].url 라이선스 URL String
- 라벨링 데이터 정보
-
데이터셋 구축 담당자
수행기관(주관) : 바인드웍스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김경영 02-2015-2100 [email protected] · 사업총괄 및 데이터 수집 정제 수행기관(참여)
수행기관(참여) 기관명 담당업무 일해수산 · 데이터수집 에스오씨소프트 · 데이터 가공/검수 디구루 · 학습모델구현 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김경영 02-2015-2100 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.