콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#헬스케어 #의료 #헬스케어

파킨슨병 진단을 위한 멀티모달 데이터

파킨슨병 진단을 위한 멀티모달
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 4,816 다운로드 : 33

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-13 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-07-28 담당자,연락처 변경
    2022-07-13 콘텐츠 최초 등록

    소개

    파킨슨병 환자와 비전형 파키슨증 환자의 MR, PET dicom 영상 데이터와 8개의 해부학적 영역에 대한 다형체(polygon) 혹은 원형(circle) 라벨링 데이터로 구축 되어있음

    구축목적

    대부분의 병원에서 파킨슨병 혹은 파킨슨증 환자의 진료시 volumetric MR 이나 FDG PET은 환경적인 요소로 인해 시행하지 못하고 있어 AI 학습을 이용하여 파킨슨병 환자와 비전형 파킨슨증 환자들의 진단 기술을 개선하기 위해 데이터셋을 구축하는 것이 목표임
  • 데이터 구축 규모

    데이터 구축 규모
    구 분 환자수(례) 수량
    대항목 중항목 소항목
    Multimodal PD Complete
    FDG+CIT+MR
    533 138,002
    Level-1
    (FDGorCIT)+MR
    437 65,550
    DLB_PDD Complete
    FDG+CIT+MR
    75 17,625
    Level-1
    (FDGorCIT)+MR
    29 4,350
    MSA Complete
    FDG+CIT+MR
    305 71,675
    Level-1
    (FDGorCIT)+MR
    116 19,720
    CBD_PSP Complete
    FDG+CIT+MR
    250 58,750
    Level-1
    (FDGorCIT)+MR
    120 20,400
    ET Complete
    FDG+CIT+MR
    10 1,900
    Level-1
    (FDGorCIT)+MR
    60 10,200
    unimodal PD Level-2
    CITorFDG
    965 87,815
    DLB_PDD 33 4,620
    MSA 127 17,780
    CBD_PSP 190 26,600
    ET 169 22,533
    비영상데이타 Multimodal+ EMR - 2,179
    (울산대학교) unimodal
    비영상데이타 unimodal EMR - 490
    (인하대병원)
    ** Parkinson Syndrome : DLB/PDD, MSA, CBD/PSP, ET 진단 해당

     

    데이터 분포

    파킨슨병 및 파킨슨 증후군 진단 분포 비율 PD 2,107 56.66%
    DLB/PDD 158 4.25%
    MSA 567 15.25%
    CBD/PSP 567 15.57%
    ET 279 7.50%
    Normal 29 0.78%
    성별 분포 비율 1,754 47.16%
    1,965 52.84%
    나이 분포  비율 30대 이하 63 1.69%
    40대 262 7.04%
    50대 744 20.01%
    60대 1,310 35.22%
    70대 1,109 29.82%
    80대 이상 231 6.21%

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
    학습 알고리즘
    학습 알고리즘

    Deep Learning – 3D CNN

    파킨슨병 진단을 위한 멀티모달-학습 알고리즘_1_Deep Learning – 3D CNN

    학습 조건 Input shape : 96×96×64
    Epoch : 500
    Optimizer : Adam
    Learning Rate : 1e-3
    Activation Function : sigmoid
    Loss function : binary cross entropy
    Batch size : 16
    파일 형식 • 학습 데이터셋: img,, header
    • 평가 데이터셋: img,, header
    전체구축 데이터 대비
    모델에 적용되는 비율
    AI모델 사용 이미지 비율(수량)
     - PD: 100%
     - Atypical PD (DLB/PDD,MSA, PSP/CBD,ET) : 100%
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 파킨슨병 진단 분류 성능 Image Classification 3D CNN AUC-ROC 0.7 단위없음 1 단위없음
    2 파킨슨병 진단 분류 민감도 Image Classification 3D CNN Sensitivity 80 % 10 %
    3 파킨슨병 진단 분류 특이도 Image Classification 3D CNN Specificity 75 % 10 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드
    구분 내용
    구축목적 파킨슨병 진단분류(classificatin)
    라벨링 방법 8개의 해부학적 영역에 대한 다형체(polygon) 혹은 원형(circle) 라벨링 
    데이터종류/형식 • 원천 데이터: 영상 DICOM (확장자: dcm)
    • 라벨 데이터: JSON
    클래스 수량 6종(PD, DLB/PDD, MSA, PSP/CBD, ET, Normal)
    데이터 실제 예시 • 원천 데이터
    • 라벨 데이터
    "images": {
        "id": "AMC_1987",
        "modality": "FP-CIT PET",
        "width": 336,
        "height": 336,
        "file_name": "AMC_1987_PD_CIT",
        "slicethickness": 1.5,
        "pixelspace": [
          1.0182099342346191,
          1.0182100534439087
        ]
      },
      "Labels": [
        {
          "ROI_name": "Right_Caudate",
          "ROI_type": "Circle",
          "Polygon_Coordinate": [],
          "Circle_Center_Coordinate": [
            [
              175,
              142,
              74
            ],
          ... ...

     

    라벨링 구성요소

    라벨링 구성요소
    구분 항목명 타입 필수여부 설명 범위
    1 info Object   데이터셋정보  
      1-1 info.name String M 뇌영상 이름  
    1-2 info.description String M 데이터셋 종류 Complete, Level 1 Incomplete, Level 2 Incomplete
    1-3 info.date_created String   데이터셋생성일자 YYYYMMDD
    2 patient Object   환자정보  
      2-1 patient.age Number M 나이 [1~100]
    2-2 patient.sex String M 성별 F: 여자, 
    M: 남자
    2-3 patient.diagnosis String M 상세 진단 PD,DLB/PDD,
    MSA,CBD/PSP,ET, Normal
    2-4 patient.type String M 진단군 PD, PD syndrome
    3 images Object   이미지정보  
      3-1 images.id String M 데이터 식별자  
    3-2 images.modality String M 뇌영상 모달리티 FP-CIT PET, FDG PET, MRI
    3-3 images.width Number M 뇌영상 너비 (복셀) [1~1000]
    3-4 images.height Number M 뇌영상 높이 [1~1000]
    (복셀)
    3-5 images.file_name String   뇌영상 파일 이니셜  
    3-6 images.slicethickness Number M 뇌영상 슬라이스 간격 [0.001~10]
    3-7 images.pixcelspace Array M 뇌영상 복셀 간격 [0.001~5]
    4 labels Array   ROI 라벨링 정보  
      4-1 labels.ROI_name String M 라벨의 해부학적 이름 Right_Caudate, Right_Anterior_Putamen, Right_Middle_Putamen, Right_Posterior_Putamen, Left_Caudate, Left_Anterior_Putamen, Left_Middle_Putamen, Left_Posterior_Putamen
    4-2 labels.ROI_type String M 라벨의 모양에 따른 라벨 유형 분류 Polygon, Circle
    4-3 labels.Polygon_Coordinate Array   다형체(polygon) 유형의 라벨일 경우 라벨에 대당하는 이미지 좌표(x, y, z) [[1,1,1] [1000,1000,1000]]
    4-4 labels.Circle_Center_Coordinate Array   ROI type이 Circle 일 경우 이미지 좌표 기준 ROI의 중심좌표 [[1,1,1] [1000,1000,1000]]
    4-5 labels.Circle_Width Array   이미지 좌표 기준 Circle ROI의 폭 1 ~ 1000
    4-6 labels.Circle_Height Array   이미지 좌표 기준 Circle ROI의 높이 1 ~ 1000
    5 neuropsychology Array   신경심리검사결과  
      5-1 neuropsychology.id String   신경심리검사종류(SNSB 2, UPDRS 3) SNSB_2, UPDRS_3
    5-2 neuropsychology.item Array   신경심리검사 항목 신경심리검사 종류가 SNSB_2 인 경우 [Attention, Language, Visuospatial Function, Memory, Frontal Function)
    신경심리검사 종류가 UPDRS_3인 경우
    [Tremor, Rigidity, BradyKinesia, Speech, Gait & Balance, Posture] 
    5-3 neuropsychology.score Array   신경심리검사 항목별 점수 [-100, 100]

     

  • 데이터셋 구축 담당자

    수행기관(주관) : 가천대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김광기 032-458-2770 [email protected] 데이터 총괄, AI모델
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    울산대학교 산학협력단 파킨슨 데이터 총괄 및 라벨링
    ㈜데이터누리 데이터 라벨링
    ㈜페트라인텔리전스 데이터 라벨링
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김광기 032-458-2770 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.