콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#태아 초음파 # 임신주수 # 태아 부위 # 학습데이터

임신중 태아 초음파 영상 데이터

임신중 태아 초음파 영상 데이터
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 6,913 다운로드 : 79

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-28 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2022-07-28 콘텐츠 최초 등록

    소개

    임신초기부터 분만시까지 연속적으로 추적한 산모를 대상으로 임신 전주기에 고른 분포로 태아의 주요부위 영상 및 진단적 가치있는 구조영역을 마스킹한 영상을 담고있는 태아 학습데이터

    구축목적

    태아 발육상태 또는 이상 여부를 파악하기 위해 임신주기별 태아 초음파 데이터로부터 주요부위를 구분하고 측정할 수 있도록 인공지능모델을 훈련하기 위한 데이터셋
    • 데이터 구축 규모
      데이터 구축 규모
        정상 태아 데이터 비정상 태아 데이터 합계
      제 1삼분기 제 2삼분기 제 3삼분기
      명수 9,021 1,524 10,545
      영상수 12,131 89,490 36,808 2,200 140,629
    • 데이터 분포
      데이터 분포
      임신주수(분기) 부위별 구조 영상수 
      임신 제1삼분기 평균 임신낭의 크기(MSD, 10주 이하) 1,781
      머리엉덩길이 (CRL, 10주 이하) 3,056
      머리엉덩길이 (CRL, 11-14주) 4,125
      목덜미 투명대 두께 (NT, 11-14주) 3,169
      임신 제2삼분기 양쪽마루뼈지름 (BPD, 15-19주) 3,197
      머리둘레 (HC, 15-19주) 2,312
      복부둘레 (AC, 15-19주) 4,560
      대퇴골 길이 (FL, 15-19주) 3,783
      단일 최대 양수 포켓 (SDP, 15-19주) 2,811
      양쪽마루뼈지름 (BPD, 20-28주) 3,681
      머리둘레 (HC, 20-28주) 2,910
      복부둘레 (AC, 20-28주) 5,895
      대퇴골 길이 (FL, 20-28주) 6,499
      상완골 길이 (HL, 20-28주) 3,050
      사방단면도(20-28주) 2,774
      좌심실유출로단면도(20-28주) 3,171
      우심실유출로단면도(20-28주) 2,138
      삼혈관단면도(20-28주) 2,736
      대동맥궁단면도(20-28주) 2,745
      단일 최대 양수 포켓 (SDP, 20-28주) 2,909
      경뇌실 단면도(20-28주) 3,474
      경소뇌 단면도(20-28주) 2,778
      윗 입술 (Upper lip, 20-28주) 2,965
      신장 (Kidneys, 20-28주) 2,400
      방광 (Bladder, 20-28주) 2,956
      외부 생식기(External genitalia, 20-28주) 1,972
      척추(Vertebrae, 20-28주) 4,010
      척골 및 요골(Ulna and radius, 20-28주) 1,052
      경골 및 비골(Tibia and fibula, 20-28주) 1,616
      손과 손가락(Hands and fingers, 20-28주) 2,451
      발과 발가락 (Foot and toes, 20-28주) 3,069
      태반 위치(20-28주) 2,608
      자궁경부 길이(20-28주) 2,968
      임신 제3삼분기 양쪽마루뼈지름(BPD, 29-36주) 4,222
      머리둘레(HC, 29-36주) 3,240
      복부둘레(AC, 29-36주) 4,995
      대퇴골 길이(FL, 29-36주) 6,134
      양수지수 (AFI, 29-36주) 3,714
      양쪽마루뼈지름(BPD, 37주-출생) 2,847
      머리둘레(HC, 37주-출생) 2,058
      복부둘레(AC, 37주-출생) 2,754
      대퇴골 길이(FL, 37주-출생) 3,619
      양수지수(AFI, 37주-출생) 3,225
      비정상 태아 데이터  증가된 목덜미 투명대 214
      사방단면도에서 심장벽 결손 확인 85
      맥락얼기 낭종 175
      뇌실확장증 221
      입술갈림증 76
      물콩팥증 331
      전치태반 607
      짧은 자궁경부 491
       
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
    • 활용 모델
      – 태아 머리 및 대퇴골 영역분할모델 개발 및 검증
      – 데이터 : 총 30,556장 사용, Train: Validation: Test = 8:1:1의 비율로 분할
      – U-Net 활용
      임신중 태아 초음파 영상 데이터-활용 모델_1_U-Net 활용
       
    • 서비스 활용 시나리오
      – 태아의 성장발육을 자동으로 분석하는 서비스
       * 서비스 내용 : 태아 성장발육 지표와 연관된 머리, 복부, 허벅지뼈 등의 영역을 자동 검출 및 분할하여 해당 영역의 넓이, 둘레 및 지름 등을 자동으로 측정하고 임신 주수별 해당 측정지표들이 표준값 대비 어느정도 편차를 가지는지 계산 및 결과 제공
       * 효과 : 주요 부위 / 구조에 대해 의료진의 수작업 측정으로 인한 오류 저감 초음파 검사시간 단축 등 업무효율성 제고 및 진단 정확도 증대
      – 태아의 다양한 부위별 구조를 분석하여 정상인지 여부를 자동으로 진단하는 서비스
       * 서비스 내용 : 태아의 주요 부위들인 심장, 혈관, 뇌 등과 아울러 복부 장기 들에 대한 주요 영역을 자동 검출 및 분할하고, 해당 영역의 넓이, 둘레 및 지름 등을 자동으로 측정을 통해 임신 주수별 해당 영역 값들이 표준값 대비 어느정도 편차를 가지는지 계산 및 결과 제공
       * 효과 : 주요 부위 / 구조에 대해 의료진의 수작업 측정 및 분석 등으로 인한 오류 저감 및 진단 정확도 증대
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 태아머리 및 허벅지뼈 영역분할 학습 모델 Image Classification U-Net mIoU 85 % 85 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드
    • 데이터셋의 종류 및 형식
      : 인공지능학습을 위한 데이터셋은 태아 초음파 영상과 임신주기별 주요 부위를 Annotation한 라벨링 영상(Polygon Segmentation) 및 임상정보 메타데이터를 포함한 라벨링 데이터셋으로 구성됨. 
      (1) 원본 데이터 : 비식별화 처리된 태아초음파 영상 (Dicom 형식)
      (2) 라벨링 데이터 
       – 임신주기별 주요부위 영역이 Annotation된 영상 (PNG 형식)
       – 임신주수, 몸무게, 주요부위 등의 임상정보를 포함한 메타데이터 (JSON 형식)

      * 원본 및 라벨링 데이터 예시
      임신중 태아 초음파 영상 데이터-데이터셋의 종류 및 형식_1_원본 및 라벨링 데이터 예시
       
    • 데이터 종류
      임신중 태아 초음파 영상 데이터-데이터 종류_1
       
    • 데이터 구성 및 어노테이션 포맷
      데이터 구성 및 어노테이션 포맷
      구분 항목명 타입 필수여부 설명 범위
      1 project_info Object   프로젝트정보  
        1–1 project_info.project_code String M 프로젝트코드 D73
        1–2 project_info.crf_no String M 증예일련번호  
      2 dicom_info Object   DICOM파일정보  
        2–1 dicom_info.modality String M modality  
        2–2 dicom_info.study_id Number M study_id  
        2–3 dicom_info.series_no Number M series_no  
        2–4 dicom_info.instance_no String M instance_no  
        2–5 image.dicom_file String M DICOM파일명 경로포함
      3 fetal Object   태아정보  
        3–1 fetal.check_part String M 부위별구조 1~43,50~57
        3–2 fetal.week Number M 임신주수㈜ 20주2일=20
      0~50
        3–3 fetal.day Number M 임신주수(일) 20주2일=2
      1~31
        3–4 fetal.comment String O 태아소견  
      4 mother Object   산모정보  
        4–1 mother.age Number O 연령 1~100 
        4–2 mother.weight Number O 초음파측정시몸무게 소수점 1자리까지표기(kg)
      1~150
      5 newborn Object   신생아정보  
        5–1 newborn.gender String O 성별 M:남,F:여
        5–2 newborn.weight Number O 몸무게 소수점 2자리
      1~10
        5–3 newborn.last_week Number O 최종분만주수㈜ 38주2일=38
      0~50
        5–4 newborn.last_day Number O 최종분만주수㈜일 38주2일=2
      1~31
        5–5 newborn.comment String O 신생아소견  
      6 annotations Object   라벨링정보  
        6–1 annotations[].masked_image_file String C masked이미지파일명 경로포함
        6–2 annotations[].category_id String C 카테고리아이디  
        6–3 annotations[].category_name String C 카테고리명  
        6–4 annotations[].attributes String C 라벨링속성  
      7 mesurements Object   라벨링정보  
        7–1 mesurements[].value String C 측정값  
        7–2 mesurements[].category_id String C 카테고리아이디  
        7–3 mesurements[].category_name String C 카테고리명  
        7–4 mesurements[].attributes String C 라벨링속성
       
    • Annotation 데이터 구조 예시
      임신중 태아 초음파 영상 데이터-Annotation 데이터 구조 예시_1
  • 데이터셋 구축 담당자

    수행기관(주관) : 고려대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    조금준 교수 02-2626-3145 [email protected] · 총괄책임
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    건국대학교 산업협력단 · 데이터 수집 및 검수
    전남대학교 산업협력단 · 데이터 수집 및 검수
    카톨릭대학교 산업협력단 · 데이터 수집 및 검수
    강원대학교 산업협력단 · 데이터 수집 및 검수
    계명대학교 산업협력단 · 데이터 수집 및 검수
    경희대학교 산업협력단 · 데이터 수집 및 검수
    중앙대학교 산업협력단 · 데이터 수집 및 검수
    부산대학교 산업협력단 · 데이터 수집 및 검수
    단국대학교 산업협력단 · 데이터 수집 및 검수
    아주대학교 산업협력단 · 데이터 수집 및 검수
    삼성서울병원 · 데이터 검수
    SQI소프트(주) · 저작/검수 도구
    · 개발/운영
    ㈜애마슈 · AI 모델 개발
    ㈜에프에이솔루션 · 데이터 품질 관리
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    조금준 교수 02-2626-3145 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.