지능형 스마트양식장(송어, 산천어) 데이터
- 분야농축수산
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-06 데이터 최종 개방 1.0 2023-07-26 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
□ 연어과(Salmonidae) 송어·산천어 스마트양식 기술 개발을 위한 종합 인공지능 데이터 구축 □ 송어·산천어 생산관리용 첨단기기와 스마트양식장 기술 개발에 활용하기 위한 AI 학습용 데이터 수집 및 구축 □ 송어·산천어 양식 연구 및 타 산업분야에서 활용 가능한 종합 데이터 모델 구축과 확산
구축목적
□ 송어·산천어 스마트양식장의 통합 데이터셋을 공개함으로써 관련 연구소 및 양식업자 등이 자유롭게 사용할 수 있도록 함. 이를 통해 개선된 융합 모델 및 서비스를 구축하는 것이 목적 □ 송어·산천어의 성장 정보 및 양식장의 수질환경 데이터를 학습한 인공지능 모델의 서비스화. 다양한 응용 서비스를 통한 스마트 양식 환경 및 최적의 생육 조건 제공
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체 수집 라벨링 유형 바운딩박스(이미지), 키포인트(이미지) 라벨링 형식 JSON 데이터 활용 서비스 AI를 기반으로 송어·산천어의 생육정보를 모니터링함으로써 생육정보를 자동 측정하고, 생육환경을 자동제어 함. 송어·산천어 성장 예측 · 먹이 생물 밀도 예측 · 질병 예측 등 각종 예측 서비스를 제공하여 최적 생육환경을 제시 데이터 구축년도/
데이터 구축량2022년/군집 데이터 142,871건 / 개체 데이터 2,984건 -
1. 데이터 구축 규모
1. 데이터 구축 규모 성과지표 구분 실적 군집이미지 원천데이터 166,340건 라벨링데이터 142,871건 개체이미지 원천데이터 3,037건 라벨링데이터 2,984건 수질환경데이터 원천데이터 1,008,981건 라벨링데이터 1,008,981건 사육관리데이터 원천데이터 4,590건 라벨링데이터 4,590건 2. 데이터 분포
- 클래스 분포2. 데이터 분포- 클래스 분포 구분 수량 비율 송어 121,810건 53.15% 산천어 107,372건 46.85% 합계 229,182건 100% - 성장 단계 분포
2. 데이터 분포- 성장 단계 분포 구분 수량 비율 치어 77,765건 33.93% 중성어 84,083건 36.69% 성어 67,334건 29.38% 합계 229,182건 100% 3. 클래스별 라벨 구성
3. 클래스별 라벨 구성 클래스 라벨 송어 개체 전체(바운딩박스) 윗입술 눈 제1등지느러미 제2등지느러미 꼬리지느러미 뒷지느러미 배지느러미 전새개골(아가미 끝) 산천어 개체 전체(바운딩박스) 윗입술 눈 제1등지느러미 제2등지느러미 꼬리지느러미 뒷지느러미 배지느러미 전새개골(아가미 끝) -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 학습 모델 선정
- EfficientNet: 이전 연구와 달리 모델의 width, depthm resolution의 dimension에 대해 새로운 scaling 방법을 적용하여 정확성이 높음
- HRNet: 고해상도에서 저해상도 컨볼루션 스트림을 병렬로 연결하여 고해상도 표현을 유지함으로써 정확도가 높은 특징점 탐지 모델임2. 개발 모델
바운딩박스 객체 인식 모델, 키포인트 객체 탐지 모델3. 개발 모델 개요
4. 성능 평가 결과
4. 성능 평가 결과 성능 지표 항목명 목표 검증 결과 달성여부 mAP 바운딩박스 객체 인식 85% 이상 85.62% 달성 OKS 키포인트 객체 탐지 70% 이상 82.31% 달성 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 바운딩박스 객체인식 Object Detection EfficientDet D2 mAP 85 % 85.62 % 2 키포인트 객체 탐지 Keypoint Detection HRNet OKS 70 % 82.31 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 원천데이터
- 송어·산천어 군집 이미지
: 송어·산천어의 군집 유영 영상 데이터를 이미지로 추출한 후, 유효한 이미지를 판별하여 저장- 송어·산천어 개체 샘플링 이미지
: 수조에서 개체를 직접 꺼내 촬영 후, 정제 기준에 따라 이미지 선별2. 라벨링 데이터
- 어노테이션 포맷
□ 송어·산천어 군집2. 라벨링 데이터- 어노테이션 포맷□ 송어·산천어 군집 구분 속성명 타입 필수 설명 작성예시 여부 1 categories array Y 카테고리 1-1 id number Y ID 1-2 name string Y 카테고리명 1-3 superclass string Y 문 1-4 class string Y 상 1-5 order string Y 목 1-6 family string Y 과 1-7 supercategory string Y 슈퍼카테고리 2 images array Y 이미지 정보 2-1 id number Y 이미지 ID 2-2 file_name string Y 파일명 2-3 width number Y 이미지 폭 2-4 height number Y 이미지 높이 2-5 date_captured string Y 획득일시 연-월-일 시:분 2-6 region string 촬영지역 2-7 light string 조명 2-8 weather string 날씨 3 growth_levels array Y 성장단계 정보 3-1 level_id number Y 성장단계 ID 1: 치어, 2: 준성어, 3: 성어 3-2 level_name string Y 성장단계명 4 annotations array Y 어노테이션 정보 4-1 id number Y 어노테이션 ID 4-2 image_id number Y 이미지 ID 4-3 category_id number Y 카테고리 ID 1: 송어, 2: 산천어 4-4 tanknum number Y 수조번호 4-5 bbox number Y 바운딩박스 4-6 keypoints array Y 갑장/갑폭 4-7 disease_exist string Y 질병이상유무 0: 질병이상없음, 1: 질병이상있음 4-8 disease_bbox array 질병이상 바운딩박스 4-9 disease_desc string 질병이상 명세 4-10 growth_days number Y 성장일수 4-11 growth_level number Y 성장단계 1: 치어, 2: 준성어, 3: 성어 □ 송어·산천어 개체
2. 라벨링 데이터- 어노테이션 포맷□ 송어·산천어 개체 구분 속성명 타입 필수 설명 작성예시 여부 1 categories array Y 카테고리 1-1 id number Y ID 1-2 name string Y 카테고리명 1-3 superclass string Y 문 1-4 class string Y 상 1-5 order string Y 목 1-6 family string Y 과 1-7 supercategory string Y 슈퍼카테고리 2 images array Y 이미지 정보 2-1 id number Y 이미지 ID 2-2 file_name string Y 파일명 2-3 width number Y 이미지 폭 2-4 height number Y 이미지 높이 2-5 date_captured string Y 획득일시 연-월-일 시:분 2-6 region string 촬영지역 2-7 light string 조명 2-8 weather string 날씨 3 growth_levels array Y 성장단계 정보 3-1 level_id number Y 성장단계 ID 1: 치어, 2: 준성어, 3: 성어 3-2 level_name string Y 성장단계명 4 annotations array Y 어노테이션 정보 4-1 id number Y 어노테이션 ID 4-2 image_id number Y 이미지 ID 4-3 category_id number Y 카테고리 ID 1: 송어, 2: 산천어 4-4 tanknum number Y 수조번호 4-5 bbox number Y 바운딩박스 4-6 keypoints array Y 갑장/갑폭 4-7 disease_exist string Y 질병이상유무 0: 질병이상없음, 1: 질병이상있음 4-8 disease_bbox array 질병이상 바운딩박스 4-9 disease_desc string 질병이상 명세 4-10 growth_days number Y 성장일수 4-11 growth_level number Y 성장단계 1: 치어, 2: 준성어, 3: 성어 4-12 body_weight string Y 체중 4-13 body_width number Y 체장 4-14 body_height number Y 체고 3. 라벨링데이터 예시
- 송어·산천어 군집
- 송어·산천어 개체4. 구축 데이터 시각화
- 송어·산천어 군집
- 송어·산천어 개체
-
데이터셋 구축 담당자
수행기관(주관) : ㈜아인스에스엔씨
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 고우리 070-7727-8686 [email protected] 총괄 책임, 데이터 포맷·가이드라인 작성, 품질관리, 가공데이터 검수, 데이터 저작도구 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜글로비트 데이터 수집, 정제 도구 개발, 데이터 정제, 데이터 구축, 크라우드 워커 모집·관리 ㈜스마트엠투엠 학습모델 구현 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 고우리 070-7727-8686 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.