-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 국내 연안에서 발전소 냉각취수 시스템 막힘, 어업피해, 쏘임사고 등을 유발하는 해파리를 초기유생 단계에서 식별할 수 있도록 이미지 데이터를 구축함.(해파리 유생 5종, 동물플랑크톤 21종)
구축목적
- 다양한 해역에서, 다음 계절 해파리 피해에 미리 대비할 수 있게 함 - 기후변화 생태계 반응 등 장기 자료 이용 연구에 활용 - 해파리 대발생 근원인 폴립 개체군의 위치를 역추적하는데 사용
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 자체수집 라벨링 유형 세그멘테이션 라벨링 형식 JSON 데이터 활용 서비스 해당사항 없음 데이터 구축년도/
데이터 구축량2023년/134,869장 -
- 데이터 구축 규모 및 분포
데이터 구축 규모 및 분포 1차 경로 2차 경로 3차 경로 파일 포맷 제출 수량 01. 자연채집 경기 - jpg .json 9,322 충남/전북 - jpg .json 12,285 전남 - jpg .json 7,011 경남 - jpg .json 8,938 경북/강원 - jpg .json 4,744 제주 - jpg .json 4,617 02. 실험실 보름달물해파리 에피라 발생조건별 실온방치 jpg .json 22,620 수온자극 jpg .json 14,945 indole jpg .json 8,125 보름달물해파리 에피라 배양조건별 성장단계 jpg .json 2,769 수온 및 먹이밀도 jpg .json 3,365 커튼원양해파리 등 3종 에피라 커튼원양해파리 jpg .json 1,231 유령해파리 jpg .json 1,376 말레이원양해파리 jpg .json 1,269 두빛보름달물해파리 jpg .json 210 03. 혼합 경기 - jpg .json 5,570 충남/전북 - jpg .json 6,236 전남 - jpg .json 6,983 경남 - jpg .json 6,692 경북/강원 - jpg .json 3,035 제주 - jpg .json 3,526 총 수량 134,869 - 클래스별 데이터 규모(객체 기준)
클래스별 데이터 규모(객체 기준) 1차분류 2차분류 Code 종명 이미지수량 수량 비율 에피라(5종) Scyphozoa 1 보름달물해파리 에피라 86,851 99,705 1.15 2 유령해파리 에피라 1,376 1,492 1.08 3 커튼원양해파리 에피라 1,231 1,352 1.1 4 말레이원양해파리 에피라 1,266 1,294 1.02 5 두빛보름달해파리 에피라 227 228 1 동물플랑크톤
(21종)Hydrozoa 6 Blackfordia 712 713 1 7 관해파리류 360 362 1.01 요각류 8 Acartia 14,977 17,299 1.16 9 Calanus 16,711 18,226 1.09 10 Centropages 2,140 2,147 1 11 Labidocera 813 818 1.01 12 Paracalanus 16,129 18,997 1.18 13 Pseudodiaptomus 3,373 3,428 1.02 14 Sinocalanus 3,485 3,630 1.04 15 Corycaeus 908 1,100 1.21 16 Oithona 1,189 1,257 1.06 지각류 17 Penilia 10,457 12,219 1.17 18 Evadne 2,320 2,442 1.05 단각류 19 단각류 1,187 1,208 1.02 갑각류 유생 20 갑각류 유생 5,042 5,332 1.06 야광충 21 야광충 4,379 5,112 1.17 모악류 22 모악류 337 337 1 미충류 23 미충류 890 893 1 피낭류 24 피낭류 296 299 1.01 어류 25 어류알 1,498 1,699 1.13 26 자치어 114 115 1.01 합계 178,268 201,704 1.13 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 모델학습
◆ 객체인식 모델 : InternImage 기반의 모델을 활용하여 학습 진행하였으며, mIoU 0.8 이상의 성능을 보임◆ 해파리 초기유생 대량 발생 예측 모델 : LSTM 모델을 이용하였으며, 과거 측정된 수온 및 밀도자료를 활용하였음.
- 서비스 활용 시나리오
구축한 모델은 해파리 초기유생 에피라를 인식하고 그 발생량을 예측하는 데에 활용할 수 있을 뿐 아니라, 동물플랑크톤 인식에 활용하고, 추가 데이터를 수집을 통한 전이학습으로 그 활용가치를 높일 수 있음 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 데이터명 세부 데이터명 상세 세부 데이터명과 구성 원시데이터 포맷 원천데이터 포맷 라벨링 데이터 포맷 해파리 초기 유생
(에피라)자연채집
(자연 채집 에피라와 동물플랑크톤)* 에피라 발생시기 현장채집 동물플랑크톤 시료(4~5월) JPG JPG JSON, TXT - 분류군/종별(주요 분류군 가중 배분 – 다양성 및 형태 유사성 고려) • 보름달물해파리 에피라 (ephyra, A. coerulea) • 동물플랑크톤 - 지역별(대량발생 빈도를 고려 지역 배분) • 경기 • 충남/전북 • 전남 • 경남 • 경북/강원 • 제주 실험실 에피라
(실험실에서 유도한 에피라)* 보름달물해파리 에피라 발생조건 별 JPG JPG JSON, TXT • 실온방치 • 수온자극 • indole * 보름달물해파리 에피라 배양조건 별 배양 조건 단계 성장단계 별(d) 1, 4, 7, 10, 13, 16, 19, 22 수온 별(°C) 15, 20 먹이 밀도 별 0, 포화 * 커튼원양해파리 등 3종 에피라 • 커튼원양해파리 • 유령해파리 • 말레이원양해파리 실험실 에피라
+ 자연동물 플랑크톤 혼합* 에피라 비발생시기 현장채집 동물플랑크톤 시료(6~10월)+ 실험실 발생 에피라 JPG JPG JSON, TXT - 혼합 시료(주요 분류군 가중 배분 - 다양성 고려) • 에피라 + 각 지역의 동물플랑크톤 - 지역별(대량발생 빈도를 고려 지역 배분) • 경기 • 충남/전북 • 전남 • 경남 • 경북/강원 • 제주 - 클래스 구분
클래스 구분 1차 분류 2차 분류 3차 분류 에피라
(5개)Scyphozoa 1 보름달물해파리 에피라 2 유령해파리 에피라 3 커튼원양해파리 에피라 4 말레이원양해파리 에피라 5 두빛보름달해파리 에피라 동물플랑크톤
(21개)Hydrozoa 6 Blackfordia 7 관해파리류 요각류 8 Acartia 9 Calanus 10 Centropages 11 Labidocera 12 Paracalanus 13 Pseudodiaptomus 14 Sinocalanus 15 Corycaeus 16 Oithona 지각류 17 Penilia 18 Evadne 단각류 19 단각류 갑각류 유생 20 갑각류유생 야광충 21 야광충 모악류 22 모악류 미충류 23 미충류 피낭류 24 피낭류 어류 25 어류알 26 자치어 - 어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수 여부 설명 범위 비고 1 image_info Object 파일정보 1-1 filename String Y 파일명 - 1-2 create_dt String Y 생성일 - 1-3 file_format String Y 파일형식 - 1-4 image_size Number Y 이미지용량 - 1-5 device String Y 촬영장비 - 1-6 resolution String Y 해상도 - 2 annotation_info List 어노테이션정보 2-1 id String Y 어노테이션ID - 2-1 label String Y 라벨명 - 2-3 label_cd String Y 라벨코드 - 01: 보름달물해파리 에피라 02: 유령해파리 에피라 03: 커튼원양해파리 에피라 04: 말레이원양해파리 에피라 05:. 두빛보름달해파리 에피라 06: Blackfordia 07: 관해파리류 08: Acartia 09: Calanus 10: Centropages 11: Labidocera 12: Paracalanus 13:Pseudodiaptomus 14: Sinocalanus 15: Corycaeus 16: Oithona 17: Penilia 18: Evadne 19: 단각류 20: 갑각류유생 21: 야광충 22: 모악류 23: 미충류 24: 피낭류 25: 어류알 26: 자치어 2-4 polygon_info Object Y 폴리곤정보 - 2-5-1 id String Y 폴리곤ID - 2-5-2 points List Y 좌표정보 - 3 meta_info Object 메타데이터 3-1 location String Y 수집장소 - 01: 경기 02: 충남/전북 03: 전남 04: 제주도 05: 경남 06: 경북/강원 07: 실험실 3-2 method String Y 수집방법 - 01: 실온방치 02: 수온자극 03: indole 3-3 sample_div Number Y 시료분할크기 >= 0 3-4 sample_volume Number Y 시료부피 >= 0 3-5 temperature String Y 수집장소수온 - 3-6 salinity Number Y 염분 - 3-7 artemia_density String Y 먹이밀도 - 01: 없음 02: 포화 03: 과포화 3-8 culture_temperature String Y 사육수온 - 3-9 ephyra_num Number Y 에피라 수 >= 0 3-10 ephyra_density Number Y 에피라 밀도 >= 0 - JSON 포맷 예시
-
데이터셋 구축 담당자
수행기관(주관) : 해양환경연구소㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 채진호 031-689-5856 [email protected] 사업관리, 수집(현장 채집), 정체 수행기관(참여)
수행기관(참여) 기관명 담당업무 국립해양생물자원관 수집(현장 채집), 정제, 자문 ㈜브랜드콘텐츠 검수, AI모델개발 아쿠아플라넷㈜ 수집(실험실 에피라) 한알음정보㈜ 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 채진호 031-689-5856 [email protected] 성건희 031-689-5856 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이명재 02-6247-0770 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 이명재 02-6247-0770 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.