-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-04-30 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
강원도를 대표하는 연어, 명태 이미지 데이터를 CCTV와 수중카메라로 획득하고, AI분석 및 예측에 적합한 AI학습용 데이터 구축
구축목적
실제 연어/명태 양식에 있어 생존율 향상에 기여할 수 있는 실용성 있는 학습용 데이터 셋을 구축하여 연어/명태 양식산업에 지능화 혁신 및 성장을 견인하고자 함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 텍스트 , 이미지 데이터 형식 jpg, csv 데이터 출처 연어, 명태양식장 라벨링 유형 세그멘테이션(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 가. 구축된 데이터셋 및 AI모델을 이용하여 연어, 명태 성장예측을 통해 성장 시기에 적절한 먹이관리, 수질관리등을 하여 생존율, 성장률 향상에 도움, 나. 명태 생존율에 핵심적으로 작용하는 수온을 예측하는 모델을 개발하여 명태 생존율을 높이고 이를 통해 사라져가는 명태 자원의 회복 데이터 구축년도/
데이터 구축량2022년/이미지데이터 12만장 -
데이터 통계
1. 데이터 구축 규모
데이터 구축 규모 구분1 구분2 데이터 항목 데이터포맷 데이터수량 이미지
데이터연어
이미지
데이터수중 연어 이미지 데이터 JPG 80,000장 JSON 80,000건 샘플링 연어 이미지 데이터 JPG 801장 명태
이미지
데이터수중 명태 이미지 데이터 JPG 40,000장 JSON 40,000건 샘플링 명태 이미지 데이터 JPG 404장 센서
데이터연어
센서
데이터DO 데이터 CSV 663,220세트 수온 데이터 CSV pH 데이터 CSV CO2 데이터 CSV ORP 데이터 CSV 유량데이터 CSV 조도 데이터 CSV 명태
센서
데이터DO 데이터 CSV 331,611세트 유입수 수온 데이터 CSV 기온 데이터 CSV 수온 데이터 CSV 유량 데이터 CSV 조도 데이터 CSV 관리
데이터연어
관리
데이터암모니아 질소 데이터 CSV 536세트 아질산염 데이터 CSV 질산염 데이터 CSV 알칼이도 데이터 CSV 총세균수 데이터 CSV 총가스압 데이터 CSV 샘플링 실측데이터(길이, 무게) CSV 801세트 먹이공급관리 데이터 CSV 264세트 생물데이터(입식, 선별, 출하) CSV 1건 일일폐사 개체수 데이터 CSV 552세트 명태
관리
데이터총가스압 데이터 CSV 268세트 바다 수온데이터 CSV 샘플링 실측데이터(길이, 무게) CSV 404세트 먹이공급관리 데이터 CSV 536세트 생물데이터 (입식, 선별, 출하) CSV 1건 일일 폐사 개체수 데이터 CSV 304세트 2. 데이터 분포
- 어종별 분포
어종별 분포 품종 성장단계 합계 비율 연어 치어 30,000 25.00% 성어 50,000 41.70% 명태 치어 10,000 8.30% 성어 30,000 25.00% 합계 120,000 100.00%
- 이미지 당 Segementation 수 분포 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드기타 정보
1. 대표성
- 실제 양식장에서의 활용도를 고려
- 연어, 명태양식은 국내에서는 양식산업 시작 초기단계로 산업에 기반이 되는 대표성 있는 데이터 부재, 본 과제를 통해 최초 빅데이터 수집
2. 독립성
- 연어, 명태양식은 국내에서는 양식산업 시작 초기단계로 독립성이 보장됨 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 연어치어 탐지 성능 Object Detection Mask R-CNN mIoU 80 % 84.91 % 2 명태치어 탐지 성능 Object Detection Mask R-CNN mIoU 80 % 81.97 % 3 연어성어 탐지 성능 Object Detection Mask R-CNN mIoU 80 % 84.66 % 4 명태성어 탐지 성능 Object Detection Mask R-CNN mIoU 80 % 84.32 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 구성 및 포맷
데이터 구성 및 포맷 구분1 구분2 구분3 데이터 항목 데이터포맷 어노테이션 데이터 구축
데이터
(원천데이터+라벨링데이터)이미지
데이터연어
이미지
데이터수중 연어 이미지 데이터 JPG 수중 연어 이미지 데이터 JSON 연어 먹이공급량 데이터 연어 폐사 개체수 데이터 DO 데이터 수온 데이터 pH 데이터 조도 데이터 샘플링 연어 이미지 데이터 JPG 샘플링 연어 이미지 데이터 명태
이미지
데이터수중 명태 이미지 데이터 JPG 수중 명태 이미지 데이터 JSON 명태 먹이공급량 데이터 명태 폐사 개체수 데이터 DO 데이터 수온 데이터 pH 데이터 조도 데이터 샘플링 명태 이미지 데이터 JPG 샘플링 명태 이미지 데이터 원천
데이터센서
데이터연어
센서
데이터DO 데이터 CSV DO 데이터 수온 데이터 CSV 수온 데이터 pH 데이터 CSV pH 데이터 CO2 데이터 CSV CO2 데이터 ORP 데이터 CSV ORP 데이터 유량데이터 CSV 유량데이터 조도 데이터 CSV 조도 데이터 명태
센서
데이터DO 데이터 CSV DO 데이터 유입수 수온 데이터 CSV 유입수 수온 데이터 기온 데이터 CSV 기온 데이터 수온 데이터 CSV 수온 데이터 유량 데이터 CSV 유량 데이터 조도 데이터 CSV 조도 데이터 관리
데이터연어
관리
데이터암모니아 질소 데이터 CSV 암모니아 질소 데이터 아질산염 데이터 CSV 아질산염 데이터 질산염 데이터 CSV 질산염 데이터 알칼이도 데이터 CSV 알칼이도 데이터 총세균수 데이터 CSV 총세균수 데이터 총가스압 데이터 CSV 총가스압 데이터 샘플링 실측데이터(길이, 무게) CSV 샘플링 실측데이터(길이, 무게) 먹이공급관리 데이터 CSV 먹이공급관리 데이터 생물데이터(입식, 선별, 출하) CSV 생물데이터(입식, 선별, 출하) 일일폐사 개체수 데이터 CSV 일일폐사 개체수 데이터 명태
관리
데이터총가스압 데이터 CSV 총가스압 데이터 바다 수온데이터 CSV 바다수온데이터 샘플링 실측데이터(길이, 무게) CSV 연어 먹이공급량 데이터 먹이공급관리 데이터 CSV 명태 먹이공급량 데이터 생물데이터 (입식, 선별, 출하) CSV 연어 생체량 데이터 (입식, 선별, 출하) 일일 폐사 개체수 데이터 CSV 명태 생체량 데이터 (입식, 선별, 출하) 어노테이션 포맷
어노테이션 포맷 속성명 속성 설명 데이터 타입 필수여부 예시 info 기본 정보 object 필수 - description 데이터셋 이름 string 필수 salmon/pollack dataset url 데이터셋 제작자 url string 선택 www.iscilab.com version 제작 버전 string 필수 1 year 제작 년도 string 선택 2022 contributor 데이터셋 제공자 string 필수 iscilab date_created 데이터셋 제작 시간 string 필수 44835.38542 licenses 저작권 정보 array 필수 - url 저작권 제작자 url string 선택 www.iscilab.com id 저작권 고유 번호 string 필수 1 name 저작권 이름 string 선택 Attribution categories 카테고리 리스트 array 필수 - supercategory 큰 분류의 카테고리 string 필수 salmon id 카테고리 고유 번호 string 필수 10 code 코드 string 필수 salmon_fry images 이미지 데이터 정보 array 필수 - license 저작권 번호 string 필수 1 file_name 원천데이터 이름 string 필수 SF10_T03_12345678.jpg id 이미지 고유번호 number 필수 12345678 height 세로 길이 number 필수 720 width 가로 길이 number 필수 1280 coco_url coco 다운로드 url string 선택 - flickr_url 플리커 등록 url string 선택 - farm_id 양식장 아이디 number 필수 1 tank_id 수조 아이디 number 필수 3 file_format 파일 포맷 string 필수 jpg cctv_id CCTV 아이디 number 선택 3 weather 날씨 string 선택 - recording_time 녹화 시간 string 필수 44821.80208 annotations 어노테이션 정보 array 필수 - id annotation ID number 필수 1 segmentation 객체 폴리곤 좌표 array 필수 60,120,65,129,69,134,… area 영역면적 number 필수 1295.5 bbox 객체 폴리곤의 바운딩박스 array 선택 50,110,90,195 iscrowd 객체의 단일 여부 number 선택 0 image_id 이미지 고유번호 number 필수 12345678 category_id 카테고리 고유 번호 string 필수 1 farm info 양식장 정보 object 필수 - id 양식장 아이디 number 필수 0 name 양식장 이름 string 선택 양식장 1 location 양식장 위치 string 선택 경기도 tank info 수조 정보 object 필수 - id 수조 아이디 number 필수 3 farm_id 양식장 아이디 number 필수 0 name 수조 이름 string 선택 수조 3번 size 수조 크기(미터 단위) string 선택 3.5 object_count 이미지 상의 개체수 number 필수 8
실제예시 -
데이터셋 구축 담당자
수행기관(주관) : 명선해양산업(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박범희부장 [email protected] 사업총괄, 데이터 수집관리, 데이터 품질검증 수행기관(참여)
수행기관(참여) 기관명 담당업무 강원도 환동해본부 테스트베드 관리, 사업자문 강원도 한해성수산자원센터 테스트베드 관리, 사업자문 가톨릭관동대학교 산학협력단 데이터 정제, 데이터 라벨링, 크라우드워커 관리 (재)한국디지털합진흥원 데이터 정제, 데이터 라벨링, 크라우드워커 관리 ㈜아이싸이랩 데이터품질검증, AI모델 개발
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.