※ 해당 데이터는 추후 수정/보완 작업으로 변경 될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3 2024-04-23 원천데이터, 라벨링데이터 수정 1.2 2023-10-26 원천데이터, 라벨링데이터 수정 1.1 2023-06-14 원천데이터, 라벨링데이터 수정 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-12-22 구축활용가이드 및 데이터 통계 표 정렬 2022-10-20 신규 샘플데이터 개방 2022-07-29 콘텐츠 최초 등록 소개
– 반려동물 10,000마리 이상 – 반려견 7종, 반려묘 4종 피부질환으로 판정된 반려동물 질환 이미지 – 반려동물(반려견, 반려묘) 이미지 총 500,000장 이상 – 질환 이미지 25만장 이상
구축목적
– 양질의 학습데이터 확보를 기반으로 향후 다양한 반려동물 질환 관련 AI 기술 개발에 있어서 향상된 품질 기대 – 아직 시장 초기 단계인 펫테크𐩐펫헬스케어 관련 기술 발전의 토대 마련, 국가차원의 경쟁력 향상 – 원인이 다양하고 치료가 어려운 반려동물 피부질환의 특성을 빠른 질환 진단을 통한 조기치료를 통해 극복 및 비용 부담 경감
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 동물병원 라벨링 유형 바운딩박스(이미지), 세그멘테이션(이미지) 라벨링 형식 json 데이터 활용 서비스 피부질환 진단 서비스 데이터 구축년도/
데이터 구축량2021년/피부질환 데이터 500,000장 -
[반려견 피부질환 수집 데이터 구성]
[반려견 피부질환 수집 데이터 구성] 구분 장비 증상 증상 여부 이미지 수 반려견 일반 카메라
스마트폰 카메라
(피부질환 이미지)구진,플라크 유증상 40,600 무증상 40,600 비듬,각질,상피성잔고리 유증상 67,300 무증상 67,300 태선화,과다색소침착 유증상 67,300 무증상 67,300 농포,여드름 유증상 15,000 무증상 15,000 미란,궤양 유증상 15,000 무증상 15,000 결절,종괴 유증상 15,000 무증상 15,000 장비 질병 질병구분 이미지 수 현미경용
디지털카메라
(cytology)감염성 피부염 감염성 3,000 비감염성 3,000 [반려묘 피부질환 수집 데이터 구성]
[반려묘 피부질환 수집 데이터 구성] 구분 장비 증상 증상 여부 이미지 수 반려묘 일반 카메라
스마트폰 카메라
(피부질환 이미지)농포,여드름 유증상 8,460 무증상 8,460 비듬,각질, 유증상 8,460 상피성잔고리 무증상 8,460 결절,종괴 유증상 8,460 무증상 8,460 장비 질병 질병구분 이미지 수 현미경용
디지털카메라
(cytology)감염성 피부염 감염성 1,420 비감염성 1,420 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1차 동물병원 적용방안(예시) 1차 동물병원 적용방안(예시) 반려동물 보호자 적용방안(예시) (피부질환에 대한 동물별 map 제공)
(모바일 앱을 통한 피부 이상 확인)
- 1차 동물병원 피부 질환 진단 보조
- 피부과 비전공 수의사에게 학습된 피부질환에 대한 감별질환 목록을 안내하고 우선 순위에 따른 치료방침을 제시하여 조기 치료가 가능한 질병은 신속하게 치료하고, 알러지, 면역매개성, 내분비, 종양성 피부질환과 같이 전문병원 치료가 필요할 경우 해당 2차, 3차 병원을 연계할 수 있는 서비스 제공
- 핸드폰 촬영을 활용한 진단
- 동물병원 방문이 쉽지 않은 일반 사용자들에 대하여 모바일 어플리케이션 등을 제공하여 사진 촬영만으로 손쉽게 진단내용을 얻고 치료 시 그 반응을 객관적으로 모니터링하고 담당병원으로 전송 및 분석할 수 있는 서비스 제공
- 질환 진단 및 연구 지원
- 수의사들로 하여금 피부질환에 대하여 표준 이미지 데이터로 활용될 수 있음
- 반려동물 질환에 대한 이미지 사진에 대한 데이터는 각 기관 및 병원에서 자체 보유하고 있는 데이터 외에 공개되어 있는 데이터는 거의 전무한 상태로 이번 AI데이터 구축 과제를 통해 다양한 연구 및 논문 지원 가능
- 국내 반려동물 품종 분포가 국외와 다르므로 국내 실정에 적합한 중요 피부질환에 대한 사진집을 출간하여 수의과대학 학생 및 전문의 교육과정에 활용할 수 있음
- 반려동물 피부 진단 알고리즘 개발 및 검증
- 구축된 반려동물 피부질환 데이터셋을 피부질환 진단 알고리즘 개발, 검증에 활용할 수 있음. 알고리즘 개발 능력이 부족한 회사는 공개된 진단 알고리즘을 활용할 수 있음
- 1차 동물병원 피부 질환 진단 보조
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 피부질환 증상 분류 Image Classification Inception-v4 Accuracy 80 % 81.24 % 2 피부질환 영역 분할 Image Classification Inception-v4 Accuracy 80 % 81.19 % 3 안구질환 분류 Image Classification ResNet Accuracy 80 % 90.81 % 4 안구질환 분류 Image Classification ResNet F1-Score 0.8 점 0.908 점 5 피부질환 증상 분류 Image Classification Inception-v4 Recall 80 % 80.48 % 6 피부질환 영역 분할 Image Classification Inception-v4 Recall 80 % 81.19 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 포맷 정의
데이터 포맷 정의 구분 데이터 주요 내용 파일형식 원시 데이터 학습을 목적으로 획득 단계에서 수집 또는 생성한 이미지 데이터 jpg 의무기록 정보에서 질환별 진료 단계에서 생성되어 가공되지 않은 데이터 csv 원천 데이터 원시 데이터를 특정 정제 과정을 거쳐 라벨링 작업에 용이하도록 만든 이미지 데이터 jpg 개인정보 비식별화, 리사이즈 등의 정제 작업을 거쳐 생성된 데이터 csv 학습용 데이터 원천 데이터를 사용하여 라벨링 작업을 실시하여 AI 학습에 적합하게 구축된 데이터 jpg 이미지 파일과 라벨링 정보를 가지고 있는 파일로 구성 JSON - 피부질환 데이터 속성 정의
<일반 카메라>
라벨은 다음과 같이 구성되며, 항목별 타입과 필수여부 및 값 범위를 정의한다.피부질환 데이터 속성 정의 구분 항목명 타입 필수여부 설명 범위 비고 1 metaData Object 이미지 정보 1-1 Raw data ID String Y 파일명 1-2 copyrighter String Y 저작권자 “(주)미소정보기술” 1-3 resolution String Y 해상도 “1920x1080” 1-4 date String Y 촬영 일자 “YYYY-MM-DD” 1-5 breed String Y 품종 말티즈, 포메라니안,푸들 1-6 age String Y 나이 1~30 1-7 gender String Y 성별 “F”
“M”1-8 region String Y 촬영위치 “L”
“H”
“B”
“A”L=다리
H=머리
B=몸통
A=연접부1-9 camera type String Y 촬영장비 “IMG”,
“CYT”1-10 species String Y 반려종 “D”
“C”1-11 lesions String Y 증상 “A1”,
“A2”,
“A3”,
“A4”,
“A5”,
“A6”,
“A7”A1=구진/플라크
A2=비듬/각질/상피성잔고리
A3=태선화/과다색소침착
A4=농포/여드름
A5=미란/궤양
A6=결정/종괴
A7=무증상1-12 diagnosis String Y 질병 “null” 공백 1-13 Path String Y 이미지 폴더명 “유증상”,
“무증상”1-14 identifier Y 데이터 구분 “피부질환” 1-15 src_path Y 파일 경로 “/라벨링데이터/반려견/피부/일반카메라/" 1-16 label_path Y 데이터셋 경로 “/라벨링데이터/반려견/피부/일반카메라/" 1-17 type Y 데이터 타입 “json” 1-18 fileformat Y 이미지 포맷 “jpg” 2 inspRejectYn String 반려처리 여부 3 labelingInfo Object 3-1 polygon Object Y 3-1-1 color String Y 라벨링 색상 3-1-2 location Object Y 라벨링 좌표 3-1-3 label String Y 라벨링 이름 “A1_구진_플라크”
“A2_비듬_각질_상피성잔고리”“A3_태선화_과다색소침착”
“A4_농포_여드름”
“A5_미란_궤양”
“A6_결절_종괴”
“A7_무증상”3-1-4 type String Y 저작도구 종류 “polygon” 3-2 box Object Y 3-2-1 color String Y 라벨링 색상 3-2-2 location Object Y 라벨링 좌표 3-2-3 label String Y 라벨링 이름 “A1_구진_플라크”
“A2_비듬_각질_상피성잔고리”“A3_태선화_과다색소침착”
“A4_농포_여드름”
“A5_미란_궤양”
“A6_결절_종괴”
“A7_무증상”3-2-4 type String Y 저작도구 종류 “box” ※ ‘항목명’, ‘타입’, ‘설명’은 필수 입력 대상이며, ‘필수여부’에 해당하는 항목의 경우, 반드시 ‘Y’로 표기한다.
※ 동일한 데이터 셋에 다수 개 스키마를 적용한 경우, 스키마 별로 라벨 구성요소를 작성한다.
<현미경_카메라>
현미경_카메라 구분 항목명 타입 필수여부 설명 범위 비고 1 metaData Object 이미지 정보 1-1 Raw data ID String Y 파일명 1-2 copyrighter String Y 저작권자 “(주)미소정보기술” 1-3 resolution String Y 해상도 “1920x1080” 1-4 date String Y 촬영 일자 “YYYY-MM-DD” 1-5 breed String Y 품종 말티즈, 포메라니안,푸들 1-6 age String Y 나이 1~30 1-7 gender String Y 성별 “F”
“M”1-8 region String Y 촬영위치 “L”
“H”
“B”
“A”L=다리
H=머리
B=몸통
A=연접부1-9 camera type String Y 촬영장비 “IMG”,
“CYT”1-10 species String Y 반려종 “D”
"C"1-11 diagnosis String Y 질병 “C1”,
“C6”C1=감염성 피부염
C6=비감염성 피부염1-12 Path String Y 이미지 폴더명 “감염성피부염”,
“비감염성피부염”1-13 identifier 데이터 구분 “피부질환” 1-14 src_path 파일 경로 “/라벨링데이터/반려견/피부/현미경/
"1-15 label_path 데이터셋 경로 “/라벨링데이터/반려견/피부/현미경/
”1-16 type 데이터 타입 “json” 1-17 fileformat 이미지 포맷 “jpg” 2 inspRejectYn String 반려처리 여부 3 labelingInfo Object 3-1 polygon Object Y 3-1-1 color String Y 라벨링 색상 3-1-2 location Object Y 라벨링 좌표 3-1-3 label String Y 라벨링 이름 “C1_감염성피부염”, “C6_비감염성피부염” 3-1-4 type String Y 저작도구 종류 “polygon” 3-2 box Object Y 3-2-1 color String Y 라벨링 색상 3-2-2 location Object Y 라벨링 좌표 3-2-3 label String Y 라벨링 이름 “C1_감염성피부염”, “C6_비감염성피부염” 3-2-4 type String Y 저작도구 종류 “box” ※ ‘항목명’, ‘타입’, ‘설명’은 필수 입력 대상이며, ‘필수여부’에 해당하는 항목의 경우, 반드시 ‘Y’로 표기한다.
※ 동일한 데이터 셋에 다수 개 스키마를 적용한 경우, 스키마 별로 라벨 구성요소를 작성한다.
- 피부질환 데이터 속성 정의
-
데이터셋 구축 담당자
수행기관(주관) : ㈜미소정보기술
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강태준 02-2205-0551 [email protected] · 저작도구 개발 · 라벨링 도구 제공 · 데이터 저장 및 보관 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜바이오데이즈 · 피부질환 데이터 수집, 정제, 가공 진행 ㈜가치랩스 · 피부질환 데이터 인공지능 개발, 유효성 검증 진행 ㈜에스에스엘 · 안구 및 피부질환 데이터 의미정확성 및 구문정확성 검증
· 통계적 다양성 검증데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 강태준 02-2205-0551 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.