※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-07-05 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-07-05 산출물 공개 Beta Version 소개
- 말초 혈관 환자의 진단을 위해 초음파데이터 35,000장을 구축하여 각각의 데이터는 인공지능 학습이 가능하도록 가공하되, plaque, 근육, 피하지방, 동맥, 정맥, 혈관벽 등 해부학적 영역에 대해 polygon 가공함
구축목적
- 말초 혈관 질환을 진단할 수 있는 AI 학습용 이미지 데이터 구축
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 *.jpg 데이터 출처 자체수집 라벨링 유형 세그멘테이션 라벨링 형식 *.JSON 데이터 활용 서비스 해당사항 없음 데이터 구축년도/
데이터 구축량2023년/초음파데이터 35,000장 -
- 데이터 구축 규모 및 분포
데이터 구축 규모 및 분포 구분 규모 파일 형태 Artery 2D 이미지 4,564장 JPG, JSON Carotid 2D 이미지 23,242장 JPG, JSON Vein 2D 이미지 7,194장 JPG, JSON 데이터 구축 규모 및 분포2 세부
데이터명데이터 구분 구축수량 (명/건) 경동맥 협착 소계 3,069 / 23,242 * 협착 중증도 별 · Normal
· Mild
· Moderate
· Severe93 / 167
2,019 / 16,018
377 / 2,736
580 / 4,321하지동맥 협착 소계 404 / 4,564 * 협착 중증도 별 · Normal
· Mild
· Moderate
· Severe31 / 85
279 / 3,456
53 / 453
41 / 570세부
데이터명데이터 구분 구축수량 (명/건) 심부정맥 혈전증 소계 859 / 7,194 * 혈전 유무별 · Normal
· Abnormal68 / 400
791 / 6,794합계 4,332 / 35,000 - 클래스별 데이터 비율
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드AI 모델 상세 데이터명 세부
데이터명AI모델 task AI모델
(후보)성능 지표
및 목표값Data I/O 말초혈관
초음파
데이터말초혈관
초음파
데이터Object Detection / Segmentation UNet ACC(80%) Input data : 초음파 이미지
output data : plaque, 혈관 영역Classification ResNet ACC(80%) Input data : 초음파 이미지
output data : 질환명- 말초혈관 초음파 데이터
·Object Detection / Segmentation
- Biomedical 분야에서 초음파 영상 분석에 많이 활용되는 인공지능 모델인 UNet을 말초혈관 초음파 영상 분석에 활용할 수 있도록 적절하게 모델을 변형
- Encoder, Decoder에 포함되는 Block의 형태를 변형하여 모델을 커스터마이즈하여 개발
- 초음파 영상의 특성을 고려하여, Encoder에 사용되는 Block에 Feature 값을 Remapping 하는 방식으로 모델 커스터마이즈 예정
·Classification
- 초음파 데이터를 활용한 Classification에 많이 활용되는 ResNet을 활용하여 AI 모델을 개발
- 단일 ResNet을 활용할 계획이지만, 파라미터가 매우 많아 성능이 다소 떨어질 수 있음을 고려하여, SqueezeNet이나 AlexNet 과같이 적은 파라미터의 모델을 앙상블 학습하여 모델을 개발 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 데이터명 세부
데이터명클래스 구분 구축 비율 말초혈관
초음파 데이터말초혈관
초음파 데이터영역별 plaque 30.00% 혈전 20.00% 근육 및 지방 20.00% 혈관 30.00% 질환별 경동맥 협착 48.00% 하지동맥 협착 17.00% 심부정맥혈전증 35.00% - 어노테이션 포맷
어노테이션 포맷 번호 속성명 속성설명 타입 형식/범위 예시 1 image_info 이미지정보 Object 1-1 filename 파일명 String [파일명] 20230504_1
231-2 hospital 수집병원 String - 삼성서울병원 1-3 file_format 파일포맷 String - JPG 1-4 image_size 이미지크기 String - 6400KB 1-5 device 촬영장비정보 String - SS900N 1-6 resolution 해상도 String - 1920x1080 2 annotation_info 어노테이션정보 List - 2-1 id 어노테이션 ID String - A_1234567 2-2 label 라벨명 String - plaque 2-3 polygon_info 폴리곤 정보 Objcet - 2-3-1 id 폴리곤 ID String - 2-3-2 points 폴리곤 좌표정보 List - 3 patient_info 환자 메타정보 Object - 3-1 code 환자번호 String - SS000001 3-2 age 연령대 String - 30대 3-3 sex 성별 String - M 3-4 c_date 검사연월 String YYYYMM 202305 4 type 질환종류 String - 하지동맥협착 5 severity 중증도 String - 6 blood_vessel_type 혈관종류 String - 동맥,정맥 7 plane_type 축 종류 String - Longitudinal,
Axial- 실제 json 예시
{"image_info": {"filename": "DATA_00100779", "hospital": "경북대학교병원", "file_format": "jpg", "file_size": "69KB", "device":
"GE Healthcare / LOGIQE9", "file_type": "US", "resolution": "960x720"}, "annotation_info": [{"polygon_info": {"id":
"PLY_202312211302040000002", "points": [[280.7375886524895, 179.91753632580156], [337.92907801419153, 175.9587734392036], [
408.7375886524894, 173.97939199590462], [462.2978723404327, 172.98970127425508], [514.0425531914966, 172.98970127425508], [
563.0638297872413, 173.97939199590462], [575.7730496453972, 180.90722704745102], [573.0496453900781, 218.51547447013144], [
484.9929078014256, 221.4845466350799], [351.5460992907873, 227.42269096497677], [307.9716312056809, 228.41238168662628], [
283.4609929078086, 226.43300024332729]]}, "label_cd": "13", "label": "근육 및 지방", "id": "ANT_202312211302040000002"}, {
"polygon_info": {"id": "PLY_202312211302040000003", "points": [[281.25621911123653, 267.44782666568733], [319.02075811832884,
263.6474142945533], [379.3699943929902, 260.48278850004186], [402.6097107050469, 254.14876788148518], [442.11722843554327,
254.14876788148518], [482.86075811832865, 248.44576481001724], [556.0658645013075, 238.31133182032653], [580.9745334000822,
233.24649984024802], [580.9745334000822, 247.8147472629285], [503.1214837546923, 261.7495926237532], [449.0891433291604,
266.8168091185986], [412.486590137671, 268.0836132423099], [351.48233481852213, 276.9512421082893], [307.9078667334157,
286.4522730361243], [307.9078667334157, 286.4522730361243], [282.34417879015325, 291.5194895309697]]}, "label_cd": "12", "label":
"혈관", "id": "ANT_202312211302040000003", "diameter": [[580.7303466796875, 238.3805160522461], [280.39146423339844,
279.1504821777344]]}], "patient_info": {"code": "KAR09180032450005", "age": "50대", "sex": "1", "c_date": "202306"}, "type":
"하지동맥협착", "blood_vessel_type": "동맥", "plane_type": "Longitudinal", "location": "", "severity": "Moderate"} -
데이터셋 구축 담당자
수행기관(주관) : ㈜브랜드콘텐츠
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최훈녕 010-9456-3520 [email protected] 과제총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 경북대학교병원 데이터 획득 양산부산대학교병원 데이터 획득 삼성서울병원 데이터 획득 ㈜모니터코퍼레이션 데이터 정제 ㈜인비즈 데이터 정제 ㈜선도소프트 데이터 가공 ㈜코코아플러스 데이터 가공 대한심장혈관영상의학회 데이터 검수 및 자문 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 이명재 02-6247-0770 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이명재 02-6247-0770 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 이명재 02-6247-0770 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.