콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#헬스케어 의료

피부질환 병리검사 이미지 데이터

피부질환 병리검사 이미지 데이터 아이콘 이미지
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 텍스트 , 이미지
구축년도 : 2022 갱신년월 : 2024-04 조회수 : 8,432 다운로드 : 26

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.2 2024-04-02 최종데이터 수정 개방 라벨링데이터 추가
    1.1 2024-01-26 데이터 최종 개방
    1.0 2023-07-31 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-01-31 산출물 전체 공개

    소개

    서울대병원, 가톨릭대학교, 국립암센터, 삼성서울병원이라는 국내 최대 규모의 병원 과 대학들이 확보하고 있는 피부암 병리 이미지를 데이터셋으로 구축하여 국내 환자 군을 대표할 수 있는 피부암 병리 코호트를 구축
    - 임상적으로 중요하고 발병률이 높은 주요 피부질환 6종과 정상피부조직에 대해 인공지능 알고리즘 개발을 위한 레이블링 및 병변 아노테이션이 결합된 피부 병리 데이터셋을 구축

    구축목적

    - 흔한 피부질환들과 정상 피부의 병리 조직을 고해상도 디지털 병리 이미지 파일로 구축
    - 특히 피부종양들과 그와 감별이 필요한 질환, 정상 피부를 각각 병리 이미지 데이터셋으로 구축하여 향후 인공지능 학습 효과를 극대화하고, 향후 피부질환 병리 영상의 객관적이고 정확한 판독 및 신속한 진단이 가능하도록 진단 보조역할을 수행하는 인공지능 모델 개발의 기반을 형성하고자 함
  • 1. 데이터 구축 규모

    1. 데이터 구축 규모
    질환명 구축량
    질환 1. 표피낭종 (Epidermal cyst) 환자 4,330명 / 이미지 5,036건
    질환 2. 지루각화증 (Seborrheic keratosis) 환자 4,516명 / 이미지 5,133건
    질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 환자 3,199명 / 이미지 5,031건
    질환 4. 기저세포암 (Basal cell carcinoma) 환자 3,362명 / 이미지 5,419건
    질환 5. 멜라닌세포모반 (Melanocytic nevus) 환자 4,293명 / 이미지 5,036건
    질환 6. 흑색종 (Malignant melanoma) 환자 1,534명 / 이미지 3,000건
    정상 1. 정상 피부 조직 (Normal) 환자 3,467명 / 이미지 5,721건

    2. 데이터 분포
    1) 질환별 분포

    2. 데이터 분포 1) 질환별 분포
    품질특성 Clinical_information  이미지(건)  비율
    요건적 다양성 질환 1. 표피낭종 (Epidermal cyst)              5,036 14.65
    질환 2. 지루각화증 (Seborrheic keratosis)              5,133 14.93
    질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)              5,031 14.64
    질환 4. 기저세포암 (Basal cell carcinoma)              5,419 15.76
    질환 5. 멜라닌세포모반 (Melanocytic nevus)              5,036 14.65
    질환 6. 흑색종 (Malignant melanoma)              3,000 8.73
    정상 1. 정상 피부 조직 (Normal)              5,721 16.64
    합계            34,376 100.00%

    2) 속성별 분포

    2. 데이터 분포 2) 속성별 분포
    품질특성 세부데이터명 데이터 규모 파일 규모 구분 분류  이미지(건)  결과(%)
    통계적 다양성 질환 1. 표피낭종 (Epidermal cyst) 5,036 5,036 위치별 분포 HEAD_NECK       2,212 43.92
    TRUNK       2,323 46.13
    EXTREMITY          467 9.27
    NS           34 0.68
    시술명 분포 Biopsy       2,423 48.11
    Resection       2,613 51.89
    남녀 성비 M       2,891 57.41
    F       2,145 42.59
    연령대별 분포 0세~9세           67 1.33
    10세~19세          184 3.65
    20세~29세          536 10.64
    30세~39세          713 14.16
    40세~49세          912 18.11
    50세~59세          993 19.72
    60세~69세          964 19.14
    70세~79세          513 10.19
    80세~89세          147 2.92
    90세~99세             7 0.14
    질환 2. 지루각화증 (Seborrheic keratosis) 5,133 5,133 위치별 분포 HEAD_NECK       2,897 56.44
    TRUNK       1,681 32.75
    EXTREMITY          531 10.34
    NS           24 0.47
    시술명 분포 Biopsy       4,726 92.07
    Resection          407 7.93
    남녀 성비 M       2,751 53.59
    F       2,382 46.41
    연령대별 분포 0세~9세             2 0.04
    10세~19세           26 0.51
    20세~29세           58 1.13
    30세~39세          166 3.23
    40세~49세          521 10.15
    50세~59세       1,103 21.49
    60세~69세       1,549 30.18
    70세~79세       1,174 22.87
    80세~89세          463 9.02
    90세~99세           71 1.38
    질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 5,031 5,031 위치별 분포 HEAD_NECK       2,442 48.54
    TRUNK       1,095 21.77
    EXTREMITY       1,418 28.19
    NS           76 1.51
    시술명 분포 Biopsy       2,073 41.21
    Resection       2,958 58.79
    남녀 성비 M       2,624 52.16
    F       2,407 47.84
    연령대별 분포 0세~9세             1 0.02
    10세~19세             - 0
    20세~29세           23 0.46
    30세~39세           98 1.95
    40세~49세          216 4.29
    50세~59세          633 12.58
    60세~69세       1,022 20.32
    70세~79세       1,443 28.69
    80세~89세       1,281 25.47
    90세~99세          311 6.18
    100세 이상             3 0.06
    질환 4. 기저세포암 (Basal cell carcinoma) 5,419 5,419 위치별 분포 HEAD_NECK       4,767 87.97
    TRUNK          445 8.21
    EXTREMITY          150 2.77
    NS           57 1.05
    시술명 분포 Biopsy       1,968 36.31
    Resection       3,451 63.69
    남녀 성비 M       2,486 45.88
    F       2,933 54.12
    연령대별 분포 0세~9세             2 0.04
    10세~19세           47 0.87
    20세~29세          106 1.96
    30세~39세          172 3.17
    40세~49세          343 6.33
    50세~59세          839 15.48
    60세~69세       1,259 23.23
    70세~79세       1,532 28.27
    80세~89세          997 18.4
    90세~99세          121 2.23
    100세 이상             1 0.02
    질환 5. 멜라닌세포모반 (Melanocytic nevus) 5,036 5,036 위치별 분포 HEAD_NECK       2,506 49.76
    TRUNK       1,529 30.36
    EXTREMITY          945 18.76
    NS           56 1.11
    시술명 분포 Biopsy       3,775 74.96
    Resection       1,261 25.04
    남녀 성비 M       1,893 37.59
    F       3,143 62.41
    연령대별 분포 0세~9세          170 3.38
    10세~19세          617 12.25
    20세~29세          886 17.59
    30세~39세          974 19.34
    40세~49세          846 16.8
    50세~59세          790 15.69
    60세~69세          490 9.73
    70세~79세          206 4.09
    80세~89세           55 1.09
    90세~99세             2 0.04
    질환 6. 흑색종 (Malignant melanoma) 3,000 3,000 위치별 분포 HEAD_NECK          447 14.9
    TRUNK          565 18.83
    EXTREMITY       1,997 66.57
    NS           21 0.7
    시술명 분포 Biopsy       2,331 77.7
    Resection          669 22.3
    남녀 성비 M       1,501 50.03
    F       1,499 49.97
    연령대별 분포 0세~9세           27 0.9
    10세~19세             4 0.13
    20세~29세           38 1.27
    30세~39세          122 4.07
    40세~49세          305 10.17
    50세~59세          533 17.77
    60세~69세          962 32.07
    70세~79세          686 22.87
    80세~89세          297 9.9
    90세~99세           26 0.87
    정상 1. 정상 피부 조직 (Normal)  5,732  5,732 위치별 분포 HEAD_NECK       1,908 33.29
    TRUNK       2,513 43.84
    EXTREMITY       1,261 22
    NS           50 0.87
    시술명 분포 Biopsy       3,953 68.96
    Resection       1,779 31.04
    남녀 성비 M       2,151 37.53
    F       3,581 62.47
    연령대별 분포 0세~9세           86 1.5
    10세~19세           77 1.34
    20세~29세          221 3.86
    30세~39세          335 5.84
    40세~49세          531 9.26
    50세~59세          980 17.08
    60세~69세       1,106 19.3
    70세~79세       1,186 20.69
    80세~89세       1,161 20.25
    90세~99세           48 0.84
    100세 이상             1 0.02

     

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 모델학습
    1) 학습모델 후보군 및 선정 근거

    1. 모델학습 1) 학습모델 후보군 및 선정 근거
    학습 모델 후보  알고리즘 및 성능지표  후보 선정 사유 최종 선정 여부 
    인공지능 기반 피부질환 분할 모델1 U-Net(Dice-coefficient) 다양한 의료 영상 분할 연구에서 사용하는 대표적인 알고리즘
    인공지능 기반 피부질환 분할 모델2 FPN 여러 데이터셋에서의 pre-trained weight를 가지고 있는 모델로써 전이학습에 용이함
    인공지능 기반 피부질환 분할 모델3 Mask R-CNN 여러 데이터셋에서의 pre-trained weight를 가지고 있는 모델로써 전이학습에 용이함
    인공지능 기반 피부질환 분할 모델4 DeepLab v3 최선 분할 모델로써 다양한 타스크에서 준수한 성능을 보임

     

    2) 성능 평가 지표 선정 및 의의
    - U-Net기반의 알고리즘으로 학습하여 Dice-coefficient의 결과값에 따라 성능 평가
    - Dice-coefficient는 영역 기반 라벨링에 대한 인공지능 분할 모델 평가 방식 중 가장 대표적인 지표
    - 병리 이미지 분할 연구에서 Dice-coefficient 값이 75%를 상회하는 경우 실제 임상 현장에서 사용 가능한 모델 성능을 보일 수 있으리라 예상되며, 충분한 임상적 의의가 있을 것



    성능 평가 지표 선정 및 의의

    [ 피부계 데이터 학습 모델 검증 예시 ]

    2. 활용 모델
    1) 피부계 데이터셋 활용AI모델 개발
    - AI 기반의 주요 6가지 피부질환별 분할 모델 개발
    2) 질환별 AI데이터 적용 임무 및 향후 AI모델 활용 방안

    데이터 명  피부계 데이터
    학습 모델  인공지능 기반 피부질환 분할 모델
    모델 U-Net
    성능 지표 각 질환별 Dice-coefficient 75% 이상
    개발 내용 구축된 인공지능 학습용 데이터셋을 활용하여, U-Net을 기반으로 WSI에 대한 질환별 분할 모델을 개발

     

    1) 표피낭종 (Epidermal cyst)
    - 표피낭종이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    (2) 지루각화증 (Seborrheic keratosis)
    - 지루각화증이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    (3) 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
    - 보웬병/편평상피암이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    - 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
    (4) 기저세포암 (Basal cell carcinoma)
    - 기저세포함이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    - 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
    (5) 멜라닌세포모반 (Melanocytic nevus)
    - 멜라닌세포모반이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    - 추후 악성흑색종과 합성 데이터셋을 구축하여 악성/양성 병변을 감별하는 모델 개발에 활용
    (6) 흑색종 (Malignant melanoma)
    - 흑색종이 위치하는 영역을 인식하는 분할 모델 개발 및 해당 질환에 대한 진단 보조 프로그램 개발
    - 악성 종양 병변의 범위를 자동으로 제시해 줌으로써, 병변의 크기, 절제연과의 거리 등의 병리 판독에 보조적 도구로 활용
    - 추후 멜라닌세포모반과 합성 데이터셋을 구축하여 악성/양성 병변을 감별하는 모델 개발에 활용
    3) 인공지능 데이터 및 모델 개발을 적용한 기술혁신 지원 방안
    - Github를 통한 모델 학습법 노하우와 최적화 방법 공유
    - 데이터 구축사업을 통해 수집된 데이터 기반의 인공지능 모델을 활용을 활성화하기 위하여 플랫폼 서버에 포팅하는 등의 오픈소스화 진행
     

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 표피낭종 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.818499999999999 단위없음
    2 지루각화증 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.9072 단위없음
    3 보웬병/편평상피암 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.8131 단위없음
    4 기저세포암 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.8526 단위없음
    5 멜라닌세포모반 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.9078 단위없음
    6 흑색종 분할 성능 Object Detection U-Net DSC 0.75 단위없음 0.817 단위없음

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 설명
    1) 세부 데이터 구성
    (1) 표피낭종 (Epidermal cyst)
    - 피부 아래 생기는 피부 각질과 부산물을 함유한 양성 낭종성 질환으로 외과적으로 치료하는 가장 흔한 양성 피부 질환 중 하나임. 정상 과립층을 가진 층상 구조의 편평세포로 둘러싸인 병변으로 표피각질형성세포 기원의 다른 종양성 병변들과 감별할 흔한 질환 중 하나로 고려되며, 드물게 해당 병변에서 피부암이 발생하는 경우가 있어 이에 대한 감별도 필요한 병변
    (2) 지루각화증 (Seborrheic keratosis)
    - 표피각질형성세포로 구성된 사마귀양 가장 흔한 양성 질환으로 외과적으로 치료하는 가장 흔한 양성 피부 질환 중 하나임. 각질형성세포에서 유래한 악성종양인 기저세포암, 보웬병, 편평상피암 뿐만 아니라 임상적으로는 멜라닌세포 기원의 흑색종까지도 감별질환으로 고려되는 등 주요한 피부암들과 감별이 필요한 병변
    (3) 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
    - 표피의 각질형성세포에서 유래한 악성종양으로 피부암 중 두 번째로 흔함. 평균 수명 증가, 자외선 노출 증가에 따라 발생률이 최근 계속 증가하고 있음. 보웬병은 상피 내 편평세포암으로 5% 이하에서 침윤 편평세포암으로 진행함. 편평세포암은 일반적인 다른 암종에 비해서는 수술적 치료로 완치율이 높은 편이나 기저세포암에 비해 재발과 전이가 더 흔하여 5년 전이율은 5%까지 보고되고 있음. 재발과 전이의 위험 인자로는 원발 종양의 크기나 침윤 깊이 등이 거론되고 있어 정확한 병리진단으로 초기에 수술적 치료를 받는 것이 치료에 중요
    (4) 기저세포암 (Basal cell carcinoma)
    - 피부암 중에서 가장 흔한 암종인 기저세포암은 인간에서 가장 흔한 암종이고 고령화 및 자외선 노출 증가로 인해 유병률도 증가하고 있음. 60세 이상에서 발생하는 경우가 가장 흔하나 최근에는 더 젊은 사람들에게서도 점점 증가하고 있으며 자외선 노출이 발병과 연관된 것으로 알려져 있음. 수술적 치료만으로 99% 완치율을 보일 정도로 정확한 진단이 선행된다면 예후는 매우 좋음
    (5) 멜라닌세포모반 (Melanocytic nevus)
    - 선천성 또는 후천성으로 발생하는 양성 멜라닌세포 증식성 질환으로 그 자체로도 흔하며 한 환자에서 다발성으로 존재함. 선천성 멜라닌세포모반의 경우 1-2%에서 흑색종으로 진행하는 경우가 있으며 후천성 멜라닌세포모반의 경우 전형적이지 않은 경우에 병리검사를 통해 악성 병변인 흑색종과의 감별 필요
    (6) 흑색종 (Malignant melanoma)
    - 세계적으로 흑색종은 증가 추세이며 발병률에 비해 높은 사망률을 보임. 미국에서는 흑색종이 전체 피부암의 4%를 차지하지만 피부암 연관 사망의 75%를 보임. 국내에서도 고령화 및 피부 질환에 대한 관심 증가로 인해 점점 발병률이 올라가고 있음. 특히 흑색종의 경우에는 인종 간 차이에 따른 아형별 차이가 큰데 비해 기존 데이터들은 대부분 서양인을 중심으로 해서 동양인의 흑색종에 대한 관심이 높아지고 있음. 진단 및 예후 예측을 위해서는 병리조직검사가 필수적이며 림프절 침범, 침윤깊이, 유사분열 수, 혈관-림프관 침윤, 미세위성병소, 종양 내 침윤림프구 등이 예후와 연관된 병리 소견으로 알려져 있음EfficientNetB0에서 가장 높은 성능을 보였음.

    1. 데이터 설명 1) 세부 데이터 구성
    진단명 질환 구분 (세포 기원) 질환 구분 (양성/악성)
    질환 1. 표피낭종 (Epidermal cyst) 상피세포 기원(Keratinocytic/epidermal) 양성
    질환 2. 지루각화증 (Seborrheic keratosis) 양성
    질환 3. 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma) 악성
    질환 4. 기저세포암 (Basal cell carcinoma) 악성
    질환 5. 멜라닌세포모반 (Melanocytic nevus) 멜라닌세포 기원(Melanocytic) 양성
    질환 6. 흑색종 (Malignant melanoma) 악성
    정상 1. 정상 피부 조직 (Normal) - -

     

    2) 데이터 구축 공정별 형식
    (1) 수집·정제 단계
    - 이미지 데이터: 2000년부터 2021년까지 참여기관 또는 참여기관 산하 대학병원에서 피부조직 병리검사(펀치 생검, 절제 생검, 수술적 절제 등)를 시행 받은 환자이면서 본 사업에서 데이터셋 구축 대상으로 정한 6가지 질환군으로 진단된 환자의 검체 중 선정 요건을 충족하는 검체를 대상으로 디지털 병리 이미지(WSI, Whole slide images) 데이터 수집
    - 텍스트 데이터: 병리 진단문 데이터로, 병원정보시스템 및 검색시스템을 활용하여 수집, 대상 증례 리스트에 새로운 일련번호 부여하고 일련번호를 통해 WSI 데이터와 매칭 가능하도록 구조화하여 수집
    - 수집된 데이터 중 중복된 데이터 또는 노이즈나 메타데이터가 포함된 데이터들은 정제하도록 함
    (2) 가공·검수 단계
    - 정제 완료된 데이터 중 정상피부조직을 제외한 질환별 WSI 데이터에 라벨링 작업을 진행하며, 이때 1개의 원천데이터(svs, mrxs, tiff)에 대하여 1개의 라벨링 데이터(json)가 생성됨 

     

    1. 데이터 설명 2) 데이터 구축 공정별 형식
    구분  수집/정제 단계  가공/검수 단계
    세부데이터 질환별 데이터 및 정상피부조직 질환별 데이터
    데이터 구분 원시데이터/원천데이터 최종데이터(라벨링데이터)
    데이터 형태 glass slides → whole slide images(digital scan files)
    HIS → clinical information file
    JSON 파일 형태로 산출
    데이터 포맷 WSI 데이터포맷: SVS, MRXS, TIFF 가공(라벨)데이터: XML 형태
    임상정보파일 데이터 포맷: CSV 최종(라벨링)데이터: JSON 형태

     

     

    2. 세부데이터 예시

    2. 세부데이터 예시

    1) 세부데이터별 원천데이터와 데이터 가공 예시
    - 표피낭종 (Epidermal cyst)

     

    ) 세부데이터별 원천데이터와 데이터 가공 예시 - 표피낭종 (Epidermal cyst)

    - 지루각화증 (Seborrheic keratosis)
     

    - 지루각화증 (Seborrheic keratosis)

    - 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

    - 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

    - 기저세포암 (Basal cell carcinoma)

    - 기저세포암 (Basal cell carcinoma)

    - 멜라닌세포모반 (Melanocytic nevus)

    - 멜라닌세포모반 (Melanocytic nevus)

     

    - 흑색종 (Malignant melanoma)

    - 흑색종 (Malignant melanoma)

     

    - 정상피부조직 (Normal)

    - 정상피부조직 (Normal)

    2) 라벨링 데이터 구성 및 실제 예시
    (1) 라벨링 데이터 구성
    - 표피낭종 (Epidermal cyst)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 표피낭종 (Epidermal cyst)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

    - 지루각화증 (Seborrheic keratosis)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 지루각화증 (Seborrheic keratosis)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1

    NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음

     

    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

     

    - 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 보웬병/편평상피암 (Bowen disease/Squamous cell carcinoma)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.INVASIVENESS String N 침윤여부 In situ, Invasive - In situ : 상피내암(침윤여부 : N)
    - Invasive : 침윤암(침윤여부: Y)
    1-10 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

     

    - 기저세포암 (Basal cell carcinoma)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 기저세포암 (Basal cell carcinoma)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

     

    - 멜라닌세포모반 (Melanocytic nevus)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 멜라닌세포모반 (Melanocytic nevus)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.TYPE String N 조직학적 분류 InvasiveIntradermal, Compound, Spitz - InvasiveIntradermal: 진피내모반
    - Compound: 합성모반
    - Spitz: 스피츠모반
    1-10 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

     

    - 흑색종 (Malignant melanoma)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 흑색종 (Malignant melanoma)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.LN_METASTASIS String N 병리학적 림프절 전이 여부 Yes, No, NS No : pN0
    Yes : pN1 이상
    1-10 Clinical_information.DISTANT_METASTASIS String N 병리학적 원격 전이 여부 Yes, No, NS -
    1-11 Clinical_information.INVASIVENESS String N 침윤여부 In situ, Invasive - In situ : 상피내암(침윤여부 : N)
    - Invasive : 침윤암(침윤여부: Y)
    1-12 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   
    2 Layer1[] List Y Candidate region 구분    
    2-1 Layer1[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    2-2 Layer1[].Region[] List Y Candidate region 좌표   좌표 {x, y}
    3 Layer2[] List Y Lesion 구분    
    3-1 Layer2[].NegativeROA Int Y NegativeROA 여부 0,1 NegativeROA : 제외영역, 0 : NegativeROA아님, 1: NegativeROA맞음
    3-2 Layer2[].coord List Y Lesion 좌표   좌표 {x, y}

     

    - 정상피부조직 (Normal)

    2) 라벨링 데이터 구성 및 실제 예시(1) 라벨링 데이터 구성- 정상피부조직 (Normal)
    구분 항목명 타입 필수 여부 설명 범위 비고
    1 Clinical_information Object Y 공통임상정보    
    1-1 Clinical_information.HOSP String Y 참여기관번호 '01','02','03','04' 01' : 서울대학교병원
    '02' : 가톨릭대학교 산학협력단
    '03' : 국립암센터
    '04' : 삼성서울병원
    1-2 Clinical_information.PATIENT_NO String Y 환자번호    
    1-3 Clinical_information.CASE_NO String Y 증례번호    
    1-4 Clinical_information.AGE Int Y 나이 0~120 검사 당시 만 나이
    1-5 Clinical_information.SEX String Y 성별 F, M  
    1-6 Clinical_information.PROCEDURE String Y 시술명 Biopsy, Resection  Biopsy: 병변의 일부를 작게 떼어내기 위한 시술
    Resection: 병변 전체를 수술적 방법으로 절제해낸 시술
    1-7 Clinical_information.LOCATION1 String Y 병변위치 카테고리 HEAD_NECK, TRUNK, EXTREMITY ,NS  
    1-8 Clinical_information.LOCATION2 String N 병변위치 Scalp, Face, Neck, Chest, Abdomen, Back, Flank, Inguinal, Axillar, Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS - HEAD_NECK : Scalp, Face, Neck, NS
    - TRUNK : Chest, Abdomen, Back, Flank, Inguinal, Axillar, NS
    - EXTREMITY : Upper arm, Forearm, Hand dorsum, Palm, Thumb, Finger, Thigh, Lower leg, Foot dorsum, Sole, Big toe, Toe, NS
    - NS : NS
    1-9 Clinical_information.PATHOLOGIST String Y 검수자 01~ 최종 검수자수   

     

    (2) 라벨링 데이터 실제 예시

    [ 라벨링 데이터 실제 예시 ]

    [ 라벨링 데이터 실제 예시 ]

  • 데이터셋 구축 담당자

    수행기관(주관) : 서울대학교병원
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이철 02-2072-4919 [email protected] 데이터 구축 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    가톨릭대학교 산학협력단 데이터 수집 및 검수
    국립암센터 데이터 수집 및 검수
    삼성서울병원 데이터 수집 및 검수
    ㈜서르 데이터 가공
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이철 02-2072-4919 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.