콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#멀티모달 #헬스케어 의료

NEW 말초 혈관 초음파 데이터

말초 혈관 초음파 데이터 아이콘 이미지
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 이미지
구축년도 : 2023 갱신년월 : 2024-10 조회수 : 3,326 다운로드 : 66

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2024-10-30 데이터 최종 개방
    1.0 2024-07-05 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-07-05 산출물 공개 Beta Version

    소개

    - 말초 혈관 환자의 진단을 위해 초음파데이터 35,000장을 구축하여 각각의 데이터는 인공지능 학습이 가능하도록 가공하되, plaque, 근육, 피하지방, 동맥, 정맥, 혈관벽 등 해부학적 영역에 대해 polygon 가공함

    구축목적

    - 말초 혈관 질환을 진단할 수 있는 AI 학습용 이미지 데이터 구축
  • - 데이터 구축 규모 및 분포

    데이터 구축 규모 및 분포
    구분 규모 파일 형태
    Artery 2D 이미지 4,564장 JPG, JSON
    Carotid 2D 이미지 23,242장 JPG, JSON
    Vein 2D 이미지 7,194장 JPG, JSON

     

    데이터 구축 규모 및 분포2
    세부
    데이터명
    데이터 구분 구축수량 (명/건)
    경동맥 협착 소계 3,069 / 23,242
    * 협착 중증도 별  
    · Normal
    · Mild
    · Moderate
    · Severe
    93 / 167
    2,019 / 16,018 
    377 / 2,736  
    580 / 4,321
    하지동맥 협착 소계 404 / 4,564
    * 협착 중증도 별
    · Normal
    · Mild
    · Moderate
    · Severe
    31 / 85
    279 / 3,456 
    53 / 453  
    41 / 570
    세부
    데이터명
    데이터 구분 구축수량 (명/건)
    심부정맥 혈전증 소계 859 / 7,194
    * 혈전 유무별
    · Normal
    · Abnormal
    68 / 400
    791 / 6,794
    합계  4,332 / 35,000

     

    - 클래스별 데이터 비율

    클래스별 데이터 비율

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
    AI 모델 상세
    데이터명 세부
    데이터명
    AI모델 task AI모델
    (후보)
    성능 지표
    및 목표값
    Data I/O
    말초혈관
    초음파
    데이터
    말초혈관
    초음파
    데이터
    Object Detection / Segmentation UNet ACC(80%) Input data : 초음파 이미지
    output data : plaque, 혈관 영역
    Unet 모델 이미지
    Classification ResNet ACC(80%) Input data : 초음파 이미지
    output data : 질환명
    ResNet 모델 이미지

    - 말초혈관 초음파 데이터
      ·Object Detection / Segmentation
        - Biomedical 분야에서 초음파 영상 분석에 많이 활용되는 인공지능 모델인 UNet을 말초혈관 초음파 영상 분석에 활용할 수 있도록 적절하게 모델을 변형
        - Encoder, Decoder에 포함되는 Block의 형태를 변형하여 모델을 커스터마이즈하여 개발
        - 초음파 영상의 특성을 고려하여, Encoder에 사용되는 Block에 Feature 값을 Remapping 하는 방식으로 모델 커스터마이즈 예정

    Object Detection Segmentation
      ·Classification
        - 초음파 데이터를 활용한 Classification에 많이 활용되는 ResNet을 활용하여 AI 모델을 개발
        - 단일 ResNet을 활용할 계획이지만, 파라미터가 매우 많아 성능이 다소 떨어질 수 있음을 고려하여, SqueezeNet이나 AlexNet 과같이 적은 파라미터의 모델을 앙상블 학습하여 모델을 개발

    Classification

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    - 데이터 구성

    데이터 구성
    데이터명 세부
     데이터명
    클래스 구분 구축 비율
    말초혈관
    초음파 데이터
    말초혈관
    초음파 데이터
    영역별 plaque 30.00%
    혈전 20.00%
    근육 및 지방 20.00%
    혈관 30.00%
    질환별 경동맥 협착 48.00%
    하지동맥 협착 17.00%
    심부정맥혈전증 35.00%

     

    - 어노테이션 포맷

    어노테이션 포맷
    번호 속성명 속성설명 타입 형식/범위 예시
    1 image_info 이미지정보 Object    
      1-1 filename 파일명 String [파일명] 20230504_1
    23
    1-2 hospital 수집병원 String - 삼성서울병원
    1-3 file_format 파일포맷 String - JPG
    1-4 image_size 이미지크기 String - 6400KB
    1-5 device 촬영장비정보 String - SS900N
    1-6 resolution 해상도 String - 1920x1080
    2 annotation_info 어노테이션정보 List -  
      2-1 id 어노테이션 ID String - A_1234567
    2-2 label 라벨명 String - plaque
    2-3 polygon_info 폴리곤 정보 Objcet -  
      2-3-1 id 폴리곤 ID String -  
    2-3-2 points 폴리곤 좌표정보 List -  
    3 patient_info 환자 메타정보 Object -  
      3-1 code 환자번호 String - SS000001
    3-2 age 연령대 String - 30대
    3-3 sex 성별 String - M
    3-4 c_date 검사연월 String YYYYMM 202305
    4 type 질환종류 String - 하지동맥협착
    5 severity 중증도 String -  
    6 blood_vessel_type 혈관종류 String - 동맥,정맥
    7 plane_type 축 종류 String - Longitudinal,
    Axial

     

    - 실제 json 예시

    {"image_info": {"filename": "DATA_00100779", "hospital": "경북대학교병원", "file_format": "jpg", "file_size": "69KB", "device": 
    "GE Healthcare / LOGIQE9", "file_type": "US", "resolution": "960x720"}, "annotation_info": [{"polygon_info": {"id": 
    "PLY_202312211302040000002", "points": [[280.7375886524895, 179.91753632580156], [337.92907801419153, 175.9587734392036], [
    408.7375886524894, 173.97939199590462], [462.2978723404327, 172.98970127425508], [514.0425531914966, 172.98970127425508], [
    563.0638297872413, 173.97939199590462], [575.7730496453972, 180.90722704745102], [573.0496453900781, 218.51547447013144], [
    484.9929078014256, 221.4845466350799], [351.5460992907873, 227.42269096497677], [307.9716312056809, 228.41238168662628], [
    283.4609929078086, 226.43300024332729]]}, "label_cd": "13", "label": "근육 및 지방", "id": "ANT_202312211302040000002"}, {
    "polygon_info": {"id": "PLY_202312211302040000003", "points": [[281.25621911123653, 267.44782666568733], [319.02075811832884, 
    263.6474142945533], [379.3699943929902, 260.48278850004186], [402.6097107050469, 254.14876788148518], [442.11722843554327, 
    254.14876788148518], [482.86075811832865, 248.44576481001724], [556.0658645013075, 238.31133182032653], [580.9745334000822, 
    233.24649984024802], [580.9745334000822, 247.8147472629285], [503.1214837546923, 261.7495926237532], [449.0891433291604, 
    266.8168091185986], [412.486590137671, 268.0836132423099], [351.48233481852213, 276.9512421082893], [307.9078667334157, 
    286.4522730361243], [307.9078667334157, 286.4522730361243], [282.34417879015325, 291.5194895309697]]}, "label_cd": "12", "label":
     "혈관", "id": "ANT_202312211302040000003", "diameter": [[580.7303466796875, 238.3805160522461], [280.39146423339844, 
    279.1504821777344]]}], "patient_info": {"code": "KAR09180032450005", "age": "50대", "sex": "1", "c_date": "202306"}, "type": 
    "하지동맥협착", "blood_vessel_type": "동맥", "plane_type": "Longitudinal", "location": "", "severity": "Moderate"}
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜브랜드콘텐츠
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    최훈녕 010-9456-3520 [email protected] 과제총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    경북대학교병원 데이터 획득
    양산부산대학교병원 데이터 획득
    삼성서울병원 데이터 획득
    ㈜모니터코퍼레이션 데이터 정제
    ㈜인비즈 데이터 정제
    ㈜선도소프트 데이터 가공
    ㈜코코아플러스 데이터 가공
    대한심장혈관영상의학회 데이터 검수 및 자문
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이명재 02-6247-0770 [email protected]
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    이명재 02-6247-0770 [email protected]
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    이명재 02-6247-0770 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.