※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-10-30 데이터 최종 개방 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 인공 디스크 치환술을 위한 bone segmentation 모델개발을 진행하기 위해 필요한 경추 CT 동영상으로부터 추출된 이미지에 라벨링 된 DICOM 데이터와 임상정보 데이터
구축목적
- 경추 인공디스크 치환술의 정확도 확보를 위한 경추 CT 데이터 구축
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 txt 데이터 출처 병원 라벨링 유형 바운딩박스, 세그멘테이션 라벨링 형식 json 데이터 활용 서비스 경추dr환자의 개인 맞춤형 치료를 위한 AI 개발 기회 제공, 치료 후 경과, 재활 모니터링을 위한 치료 수준 향상과 인공지능을 통한 질환 예후 예측 데이터 구축년도/
데이터 구축량2023년/634,347건 -
- 원천 데이터
원천 데이터 1차 경로 2차 경로 3차 경로 4차 경로 파일 포맷 제출 수량 사전 최종 C N 환자 가명 ID 획득방향
(SAG
COR
AXL
RSA
LSA).dcm 7,984 2,979,625 D F T I T N THN 4,339,369 D F T I 총 수량 7,934 7,318,994 - 라벨링 데이터
라벨링 데이터 1차 경로 2차 경로 3차 경로 4차 경로 파일 포맷 제출 수량 사전 최종 C N 환자 가명 ID 획득방향
(SAG).json 1,251 112,405 D 4,769 449,917 F 714 46,286 T 799 18,839 I 401 6,900 총 수량 7,934 634,347 - 데이터 분포
데이터 분포 No. 분류 데이터 수 비율 1 N 112,405 17.72% 2 D 449,917 70.93% 3 F 46,286 7.30% 4 T 18,839 2.97% 5 I 6,900 1.09% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 경추체 영역 분할 모델
● 모델학습
● 입력 데이터는 Sagittal view의 경추 CT 영상과 경추체 영역 polygon data 를 사용
● 딥러닝에서 주로 의료 이미지 분할 및 세그멘테이션 작업에 사용되는 신경망 아키텍처 중 하나로
2015년에 영상 분할을 위해 처음으로 소개되었으며, 특히 의료 영상에서 부종, 종양, 기관 등을 세분화하는 작업에 많이 활용되고 있는 UNet 모델을 사용함.- 경추 질환 영역 검출 모델
● 모델학습
● 입력 데이터는 Sagittal view의 경추 CT 영상과 골극, 후종인대골화증, 추간공 협착증 영역에 대한 bounding box 좌표를 사용
● 객체의 클래스와 경계 상자를 동시에 예측 가능하며, 빠른 추론 속도와 높은 정확도를 가지는 YOLOv5 모델을 사용함● 서비스 활용 시나리오
● 자동 분할 및 측정
- 딥러닝 모델을 사용하여 경추 CT 영상에서 경추체를 자동으로 분할함으로써 의료 전문가는 환자의 해부학적 특성을 빠르게 평가하는데 도움을 줌.
- 경추체의 크기, 형태 및 위치와 같은 정보를 자동으로 추출하여 이를 기반으로 환자의 건강 상태를 평가하고 치료 계획을 수립할 수 있음.● 진단 보조 도구
- 딥러닝을 통한 자동 분할은 의료 전문가들에게 정확한 해부학적 정보를 제공하여 진단의 정확성을 향상시킬 수 있음.
- 병변, 이상 소견, 혹은 진단적으로 중요한 특징들을 시각적으로 강조하고 확인하는 데 도움이 될 수 있음.● 치료 계획과 감시
- 경추 CT 영상을 기반으로 한 경추체 분할은 수술 전 치료 계획을 수립하거나 수술 중에 실시간 감시에 도움을 줄 수 있음.
- 치료 후에는 환자의 회복 상태를 추적하고, 필요한 경우 추가 치료 계획을 수정하는 데 사용할 수 있음.● 경추질환 탐지에 대한 자동화와 정확성 향상
- 경추 질환을 치료하기 위해서는 인공 디스크 치환술이 필요하며, 이를 위해서는 경추 CT 이미지에서 질환 영역을 식별하고 분할하는 기술이 필요함
- AI 기반으로 경추 CT 이미지에서 자동으로 질환 영역을 식별하고 분할하여 수동적인 진단 방법에 비해 시간과 비용을 절감하여 의료진의 효율성을 향상시킬 수 있음
- 경추 질환 영역에 대해 위치와 크기를 정확하게 분석하여 전문가 수준의 정확성과 일관성을 제공● 개인 맞춤형 치료 계획 수립
- 다양한 질환 패턴을 탐지하고 분류하여 환자마다 다른 척추 모양과 크기, 질환을 탐지할 수 있음
- AI 기반의 경추 질환 탐지 모델을 통해 정확한 진단 결과를 얻어 개인에게 맞춤형 치료 계획 수립에 활용될 수 있음 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 Key Description Type annotation - array area 바운딩박스 크기 number vMax 바운딩박스 좌표값 object x 바운딩박스 시작점 x좌표 number y 바운딩박스 시작점 y좌표 number vMin 바운딩박스 좌표값 object x 바운딩박스 시작점 x좌표 number y 바운딩박스 시작점 y좌표 number width 바운딩박스 가로 길이 number height 바운딩박스 세로 길이 number label 라벨 string type 타입 string bbox_id 바운딩박스 식별ID number m_isClosed 폴리곤 개방여부 boolean m_area 폴리곤 크기 number m_points 폴리곤 객체 좌표 array x 폴리곤 n번째점 x좌표 number y 폴리곤 n번째점 y좌표 number polygon_id 폴리곤 식별ID number images 이미지 object width 이미지 가로크기 string dataCaptured 이미지 생성일자 string height 이미지 세로크기 string dataInfo 데이터카테고리 array slice_thickness 절편두께(mm) number slice_interval 절편간격(mm) number reconstruction 재구성 알고리즘/커널 number Series 획득방향 number Clinic_info 임상정보 object PatientID 식별ID 정보 string Age 나이 number Sex 성별 number Diagnosis 진단명 string Institution 기관 string Channel 채널 string - 어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수 여부 설명 범위 1 annotation array - 1-1 area number 바운딩박스 크기 123.123 1-2 vMax object 바운딩박스 좌표값 1-2-1 x number 바운딩박스 시작점 x좌표 1 1-2-2 y number 바운딩박스 시작점 y좌표 1 1-3 vMin object 바운딩박스 좌표값 1-3-1 x number 바운딩박스 시작점 x좌표 1 1-3-2 y number 바운딩박스 시작점 y좌표 1 1-4 width number 바운딩박스 가로 길이 3 1-5 height number 바운딩박스 세로 길이 3 1-6 label string 라벨 C1 1-7 type string 타입 rect 1-8 bbox_id number 바운딩박스 식별ID 1-9 m_isClosed boolean 폴리곤 개방여부 true
false1-10 m_area number 폴리곤 크기 123.123 1-11 m_points array 폴리곤 객체 좌표 1-11-1 x number 폴리곤 n번째점 x좌표 1 1-11-2 y number 폴리곤 n번째점 y좌표 1 1-12 polygon_id nubmber 폴리곤 식별ID 2 images object y 이미지 - 2-1 width string y 이미지 가로크기 512 2-2 dataCaptured string y 이미지 생성일자 20200101 2-3 height string y 이미지 세로크기 512 3 dataInfo array 데이터카테고리 3-1 slice_thickness number 절편두께(mm) 1, 2, 3 3-2 slice_interval number 절편간격(mm) 1, 2, 3 3-3 reconstruction number 재구성 알고리즘/커널 0=Bone 3-4 Series number 획득방향 1=sagittal 4 Clinic_info object y 임상정보 4-1 PatientID string y 식별ID 정보 100001 4-2 Age number y 나이 40 4-3 Sex number y 성별 1=남
2=여4-4 Diagnosis string y 진단명 N
D
F
T
I4-5 Institution string y 기관 01=서울성모병원
02=은평성모병원
03=성빈센트병원
04=분당차병원
05=보라매병원
06=고대안암병원4-6 Channel string y 채널 CH01=64
CH02=128
CH03=192
CH04=16
CH05=256- 데이터 포맷
데이터 포맷 데이터 포맷 임상 데이터 : 텍스트
영상 이미지 : DICOM임상 데이터 : 텍스트
영상 이미지 : DICOM임상 데이터 : txt
영상 이미지 : DICOM
라벨링 : json*CSV,
DCM
json- 실제예시
-
데이터셋 구축 담당자
수행기관(주관) : 가톨릭대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 정준용 02-2258-6254 [email protected] 데이터 수집, 추출 및 정제, 가공 및 검수, 주관 행정 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜미소정보기술 데이터 가공/검수, 저작도구 툴 제공 (의료) 길의료재단 AI 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 정준용 02-2258-6254 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김광기 032-458-2879 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 박원형 02-2205-0552 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.