※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-07-13 콘텐츠 최초 등록 소개
후두암의 조기진단이 가능한 인공지능 모델을 위한 인공지능 데이터셋을 구축하기 위한 후두내시경 데이터
구축목적
후두내시경 이미지로부터 후두 양성종양과 악성종양을 감별진단을 해낼 수 있도록 인공지능을 훈련하기 위한 데이터셋
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 png, jpg 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지) 라벨링 형식 JSON, CSV 데이터 활용 서비스 후두암 및 후두질환 조기 진단 서비스 데이터 구축년도/
데이터 구축량2021년/14,077 -
데이터 통계
- 후두내시경 이미지
- 데이터 구축 규모
- 원천데이터 14,077건 / 라벨링데이터 14,077건
후두내시경 이미지 데이터 구축 규모 데이터 종류 세부 클래스 데이터 형태 구축데이터 규모 원천데이터 라벨링데이터 후두내시경 이미지 정상 이미지 5,190 5,190 양성종양 출혈성 용종 이미지 3,049 3,049 성대 내낭 이미지 872 872 성대백반증 이미지 754 754 악성종양 이미지 4,212 4,212 합 계 14,077 14,077
- 원천데이터 14,077건 / 라벨링데이터 14,077건
- 데이터 분포
- 악성종양의 경우, 성별, 연령 구분 불가
후두내시경 이미지 데이터 분포 성별 연령 합계 20-39 40-59 60이상 정상 남 229 902 895 2,026 5,190 여 679 1,607 878 3,164 양성종양 출혈성 용종 남 388 833 350 1,571 3,049 여 390 852 236 1,478 성대 내낭 남 99 230 79 408 872 여 106 228 130 464 성대백반증 남 - 262 422 684 754 여 - 7 63 70 악성종양(후두암) 남 667 1,122 1,451 3,240 4,212 여 262 549 161 972 합 계 남 1,383 3,349 3,197 7,929 14,077 여 1,437 3,243 1,468 6,148
- 악성종양의 경우, 성별, 연령 구분 불가
- 데이터 구축 규모
- 후두음성 데이터
- 데이터 구축 규모
- 원천데이터 246건 / 라벨링데이터 246건
후두음성 데이터 데이터 구축 규모 데이터 종류 세부 클래스 데이터 형태 구축데이터 규모 원천데이터 라벨링데이터 (json) 스펙트럼데이터 (csv) 후두음성 데이터 정상 이미지 68 68 68 양성종양 출혈성 용종 이미지 95 95 95 성대 내낭 이미지 14 14 14 성대백반증 이미지 9 9 9 악성종양 이미지 60 60 60 합 계 246 246 246
- 원천데이터 246건 / 라벨링데이터 246건
- 데이터 분포
- 악성종양의 경우, 성별, 연령 구분 불가
후두음성 데이터 데이터 분포 성별 연령 합계 20-39 40-59 60이상 정상 남 6 8 6 20 68 여 11 23 14 48 양성종양 출혈성 용종 남 16 28 12 56 95 여 13 19 7 39 성대 내낭 남 2 5 1 8 14 여 - 4 2 6 성대백반증 남 1 2 6 9 9 여 - - - - 악성종양(후두암) 남 1 13 44 58 60 여 - 1 1 2 합 계 남 26 56 69 151 246 여 24 47 24 95
- 악성종양의 경우, 성별, 연령 구분 불가
- 데이터 구축 규모
- 후두내시경 이미지
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 활용 모델
모델학습
- 후두암 및 용종 검출 모델
- Resnet152를 backbone으로 한 Keras-retinanet 0.5.1 기반의 후두암 및 용종 검출 모델 설계
- Resnet152를 backbone으로 한 Keras-retinanet 0.5.1 기반의 후두암 및 용종 검출 모델 설계
- 후두 성대 비대칭 판별 모델
- Resnet101을 backbone으로 한 Deeplab v3+ 기반의 후두 성대 비대칭 판별 모델 설계
- Resnet101을 backbone으로 한 Deeplab v3+ 기반의 후두 성대 비대칭 판별 모델 설계
2. 서비스 활용 시나리오
- 학습 완료된 알고리즘이 장착된 서버 또는 단말을 활용한 후두암 조기검진 서비스
- 알고리즘을 고성능 서버에 탑재하여 PACS와 연동하거나 검진실에서 바로 결과를 볼 수 있도록 고성능 시스템으로 서비스 구현.
- 인공지능 기반의 자동판독프로그램(진단)의 경우 의료기기 2등급으로서 기술문서와 시험검사 자료를 갖추어야 하고 심사대상에 해당
- 후두암 및 용종 검출 모델
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 후두 성대의 비대칭 판별 모델 Estimation RetinaNet, YOLO DSC 0.9 단위없음 0.912999999999999 단위없음 2 후두암 및 용종 검출 모델 Object Detection RetinaNet, YOLO Sensitivity 90 % 90.32 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 포맷
2. 데이터 구성
- 후두내시경 이미지
2. 데이터 구성 후두내시경 이미지 Key Description Type Child Type images 후두 이미지 정보 JsonObject id 이미지 식별자 String width 이미지 너비 Number height 이미지 높이 Number filename 이미지 파일명 String date_created 이미지 생성일자 String metas 메타정보 JsonObject id 연관메타데이터식별자 String age 나이 Number gender 성별 String disease_id 질환종류 Number disease_name 질환명 String stage 병기 String pathology 병리소견 String diagnosis 진단명 String treatment 치료방법 String annotations 라벨링정보 JsonObject [ 라벨링 JsonObject id 라벨링식별자 String image_id 연관이미지식별자 String category_id 해부학적 구조물 및 병변 정보 Number category_name 해부학적 구조물 및 병변 String types 라벨링방법 String points 라벨링폴리곤 List [ 좌표 JsonAray JsonObject [ ] ] ] - 후두음성 데이터
2. 데이터 구성 후두음성 데이터 Key Description Type Child Type images 후두음성 이미지 정보 JsonObject id 이미지 식별자 String width 이미지 너비 Number height 이미지 높이 Number filename 이미지 파일명 String date_created 이미지 생성일자 String metas 메타정보 JsonObject id 연관메타데이터식별자 String age 나이 Number gender 성별 String disease_id 질환종류 Number disease_name 질환명 String stage 병기 String pathology 병리소견 String diagnosis 진단명 String treatment 치료방법 String
3. 어노테이션 포맷
- 후두내시경 이미지
- 정상
3. 어노테이션 포맷 후두내시경 이미지 정상 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String 3 라벨링정보 annotations Object 3-1 라벨링식별자 annotations[].id 100 String Y 3-2 연관이미지식별자 annotations[].image_id 100 String Y 3-3 해부학적 구조물 및 병변 정보 annotations[].category_id 1 Number Y 3-4 해부학적 구조물 및 병변 annotations[].category_name 100 String Y 3-5 라벨링방법 annotations[].type 4 String Y poly
(polygon)3-6 라벨링폴리곤 annotations[].points 100 List Y - 양성종양 (출혈성 용종, 성대 내낭, 성대백반증)
3. 어노테이션 포맷 후두내시경 이미지 양성종양 (출혈성 용종, 성대 내낭, 성대백반증) 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String Y 3 라벨링정보 annotations Object 3-1 라벨링식별자 annotations[].id 100 String Y 3-2 연관이미지식별자 annotations[].image_id 100 String Y 3-3 해부학적 구조물 및 병변 정보 annotations[].category_id 1 Number Y 3-4 해부학적 구조물 및 병변 annotations[].category_name 100 String Y 3-5 라벨링방법 annotations[].type 4 String Y poly
(polygon)3-6 라벨링폴리곤 annotations[].points 100 List Y - 악성종양
3. 어노테이션 포맷 후두음성 데이터 악성종양 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String Y 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String Y 3 라벨링정보 annotations Object 3-1 라벨링식별자 annotations[].id 100 String Y 3-2 연관이미지식별자 annotations[].image_id 100 String Y 3-3 해부학적 구조물 및 병변 정보 annotations[].category_id 1 Number Y 3-4 해부학적 구조물 및 병변 annotations[].category_name 100 String Y 3-5 라벨링방법 annotations[].type 4 String Y poly
(polygon)3-6 라벨링폴리곤 annotations[].points 100 List Y
- 정상
- 후두음성 데이터
- 정상
3. 어노테이션 포맷 후두음성 데이터 정상 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두음성 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String - 양성종양 (출혈성 용종, 성대 내낭, 성대백반증)
3. 어노테이션 포맷 후두음성 데이터 양성종양 (출혈성 용종, 성대 내낭, 성대백반증) 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두음성 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String Y - 악성종양
3. 어노테이션 포맷 후두내시경 이미지 악성종양 구분 항목명 길이 타입 필수 여부 비고 한글명 영문명 1 후두음성 이미지 정보 images Object 1-1 이미지식별자 images[].id 100 String Y 1-2 이미지너비 images[].width 4 Number Y 1-3 이미지높이 images[].height 4 Number Y 1-4 이미지파일명 images[].filename 100 String Y 1-5 이미지생성일자 date_created 100 String 2 메타정보 metas Object 2-1 연관메타데이터식별자 metas[].id 200 String Y 2-2 나이 metas[].age 3 Number Y 2-3 성별 metas[].gender 1 String Y 2-4 질환종류 metas[].disease_id 1 Number Y 2-5 질환명 metas[].disease_name 100 String Y 2-6 병기 metas[].stage 100 String Y 2-7 병리소견 metas[].pathology 400 String 2-8 진단명 metas[].diagnosis 100 String 2-9 치료방법 metas[].treatment 100 String Y
- 정상
4. 실제예시
- 후두내시경 이미지
- 후두내시경 이미지
-
데이터셋 구축 담당자
수행기관(주관) : 고려대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 조재구 02-2626-3189 [email protected] · 사업 총괄 · 데이터 수집 및 검증 수행기관(참여)
수행기관(참여) 기관명 담당업무 (의료)길의료재단 · 데이터 수집 및 가공
· AI모델 개발 및 테스트㈜엠티이지 · 데이터 수집 및 관리 환경 구축
· 데이터 가공
· AI모델 개발 및 테스트㈜한국의료영상 · 데이터 관리 및 품질 관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 조재구 02-2626-3189 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.