콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
본 데이터는
온라인 안심존 데이터 ?

온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석

입니다.
#헬스케어 의료

흉부 청진음 데이터

흉부 청진음 데이터 아이콘 이미지
  • 분야헬스케어
  • 구분 안심존(온라인)
  • 유형 오디오 , 이미지 , 텍스트
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 4,802 다운로드 : 27

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-06 데이터 최종 개방
    1.0 2023-07-24 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-03-19 산출물 전체 공개

    소개

    청진은 심장이나 폐 질환자에서 비침습적으로 진행되는 일차검사로 임상현장에서 추가적인 비용 발생없이 반복적으로 획득할 수 있는 생체신호이며, 심장·폐 질환의 진단과정에서 필수적으로 시행되는 절차임.

    구축목적

    흉부 청진 절차에서 다양한 인공지능 연구개발에 활용될 수 있도록 잡음이 최소화된 양질의 청진음을 실제 현장의 질환빈도를 반영해 수집하고, 전문인력과 절차에 따른 참값 라벨링과 관련 임상의료데이터를 함께 수집한 학습용 빅데이터를 구축하여 ‘관련 연구개발을 촉진’하고 ‘전문 인력을 양성’하고자 함.
  •  
    원천 데이터 종류 순환기계 호흡기계
    청진음 유관데이터 청진음 유관데이터
    심장음 심전도/혈압 호흡음 흉부X선 
    원천 자료형태 음성 생체신호/텍스트 음성 2D 의료영상
    원천 데이터 포멧 .wav .jpg, .csv .wav .jpg
    라벨링데이터  24,000건 6,000건 25,195건 5,000건
    구축 규모 (6,000 x 4개 부위) (6,000 x 4개 이상 부위)

     

    심장음별 분포
    심장음별 분포
    심장음 레이블 COUNT 비율 비고
    1 22,358 93.16% 정상(normal)
    2 804 3.35% 수축기 심잡음(systolic murmur)
    3 105 0.44% 이완기 심잡음(diastolic murmur)
    4 171 0.71% 복합 심잡음(murmur)
    9 562 2.34% 판독불가
    합계 24,000 100%
     

     

    호흡음별 분포
    호흡음별 분포
    호흡음 레이블 COUNT 비율 비고
    0 15,561 61.76% 정상(normal)
    1 34 0.13% 거친 수포음(coarse crackle)
    2 494 1.96% 천명(wheezing)
    3 7,804 30.97% 가는 수포음(fine crackle)
    4 10 0.04% 건성 수포음(rhonchi)
    9 1,292 5.13% 판독불가
    합계 25,195 100%
     

     

     
    심전도 파형별 분포
    심전도 파형별 분포
    심전도 레이블 COUNT 비율 비고
    1 4,052 81.04% Sinus Rhythm(SR)
    2 666 13.32% Atrial Fibrillation(AFIB)
    3 14 0.28% Bundle Branch Block(BBB)
    4 268 5.36% Others
    합계 5,000 100%
     

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    •심장음에 대하여 정상, 수축기 심잡음, 이완기 심잡음, 복합 심잡음, 판독불가를 분류하는 인공지능 모델 개발
    • 심장음에서 MFCC(Mel-frequency cepstral coefficients) 특징을 추출하여 1D컨볼루션기반의 U-Net의 입력으로 넣어 학습 및 추론을 수행

    활용 모델

     

     활용 방안

    • AI를 활용한 심장음 기반 심장판막, 부정맥, 등 심장질환 일차진단 솔루션: 심장판막 질환, 등 청진음이 특징적인 주요 심장 질환을 일차진단하는 솔루션은 물론, 심장질환이 이미 진단된 환자에서 질환의 악화여부를 추적 관리함으로써 개별화된 예방 지침 및 추적 검사 일정을 제시하는 솔루션 개발이 가능함
    • 심장 질환 자가 모니터링 솔루션: 심장 질환 의심환자 혹은 유질환자가 자택에서 스스로 건강상태를 모니터링 하기위한 생체신호 분석 및 해석 솔루션 제공 가능. 가정용 혈압계와 같이 반복적인 측정을 통해 의료기관 내원이 필요한 질환악화, 등을 조기판별

    활용 모델

    • 호흡음에 대하여 정상, 거친수포음, 천명, 고른수포음, 건성수포음, 판독불가를 분류하는 인공지능 모델 개발
    • 호흡음의 MFCC 특징을 기반으로 1D컨볼루션기반의 U-Net을 통해 학습 및 추론을 수행

    활용 모델

    활용 방안

    • AI를 활용한 호흡음 기반 주요 호흡기질환 일차 진단 솔루션: 호흡음 학습데이터를 활용하여 1차 진료 및 응급의료 현장에서 인공지능 기반 호흡음 분석을 통해 호흡기질환을 조기에 선별하여 신속한 진단 및 즉각적인 처치가 가능하게 함
    • AI를 활용한 호흡음 기반 유행성 호흡기 감염질환 진단 솔루션: 코로나19 같은 감염 전파 비중이 큰 질환의 경우 감염 취약 시설 일반인 및 자가 격리자를 대상으로 호흡기 감염병 징후를 조기에 스크리닝해 확산을 신속히 차단하고 대규모 감염확산을 예방·관리 할 수 있는 솔루션 개발이 가능함
    • 폐 질환 자가 모니터링 솔루션: 폐 질환 의심환자 혹은 유질환자가 자택에서 스스로 건강상태를 모니터링 하기위한 생체신호 분석 및 해석 솔루션. 

    활용 모델

    • 흉부 X 선 영상에서 심장과 폐영역을 탐지하는 물체 탐지(object detection)모델 개발
    • 입력된 흉부X선 영상과 심/폐 영역 마스크를 기반으로 YOLO v5 모델을 통해 학습한 후, 심장 및 폐 영역에 대한 bounding box 생성
     

    활용 모델

    활용 방안

    • 심장의 구조적 문제 (심장 비대 및 석회화 등)의 시각적 확인을 통해 심장질환 진단을 지원
    • 폐 영역 내 구조적 변화의 시각적 확인을 통해 폐 질환 진단을 지원

     

     

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 심잡음 검출 분류 성능 Audio Classification MFCC + CNN Accuracy 80 % 82.74 %
    2 비정상 호흡음 검출 분류 성능 Audio Classification MFCC + CNN Accuracy 70 % 72.12 %
    3 심장 영역 탐지 성능 Object Detection YOLO v5 mIoU 85 % 88.89 %
    4 폐 영역 탐지 성능 Object Detection YOLO v5 mIoU 85 % 88.98 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드
    [순환기계-청진음] 심장음 데이터 구성
    [순환기계-청진음] 심장음 데이터 구성 및 어노테이션 포맷
    원시/원천데이터 (심장음 수집 4개 위치) 심장음 라벨링
    (1) MA Mitral Valve Area label: 1 
    - 5종의 심잡음 인덱스 중 하나 (1-4, 9)
     
    <심잡음 5종>
    1) 정상(normal), 
    2) 이완기 심잡음(systolic murmur),
    (2) TA Tricuspid Valve Area 3) 수축기 심잡음(diastolic murmur),
    (3) AA Aortic Valve Area 4) 복합 심잡음(murmur),
    (4) PA Pulmonary Valve Area
     
    9) 판독 불가(cannot analyze)

     

    [순환기계-청진음] 심장음 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 study_date string Y 데이터 생성일시   yyyyMMdd
    2 patient_id string Y 환자 ID (비식별화)    
    3 pcg_files array array of object Y 심장음 파일 정보    
      3-1 id string Y 심장음 파일 식별자    
    3-2 file_name string Y 심장음 파일 이름    
    3-3 3-4+G28:L40 string Y 심장음 수집 위치 MA, TA, AA, PA  
      3-4 murmur_label integer Y 심장음 카테고리 1,2,3,4,9 1: 정상(normal)
    2: 수축기 심잡음 (systolic murmur)
    3: 이완기 심잡음 (diastolic murmur)
    4: 복합심잡음
    (murmur)
    9: 판독불가
    {
    "patient_id": "1234567",
    "study_date": “20190917”,
    "pcg_files": [
    [
    {
    "id": "hs_00001_01_MA",
    "file_name": "hs_00001_01_MA.wav",
    "location": "MA“,
    "murmur_label": 1
     
    }
    ],
    [
    {
    "id": "hs_00001_01_TA",
    "file_name": "hs_00001_01_TA.wav",
    "location": "TA"
    "murmur_label": 1
    }
    ],
    [
    {
    "id": "hs_00001_01_AA",
    "file_name": "hs_00001_01_AA.wav",
    "location": "AA"
    "murmur_label": 1
    }
    ],
    [
    {
    "id": "hs_00001_01_PA",
    "file_name": "hs_00001_01_PA.wav",
    "location": "PA"
    "murmur_label": 1
    }
    ]
    ]
    }

     

    [순환기계-청진음] 호흡음 구성
    [순환기계-청진음] 호흡음 구성 및 어노테이션 포맷
    원시/원천데이터 (호흡음 수집 12개 위치 중 4개 위치 이상) 호흡음 라벨링
    Front view label: 1 
    - 6종의 호흡음 인덱스 중 하나 (0-4, 9)
     
    (1) FRUL (2) FLUL <호흡음 6종>
    right upper lung left upper lung 0) 정상(normal), 
    (3) FRML (4) FRML 1) 거친수포음(coarse crackle),
    right mid lung left mid lung 2) 가는수포음(fine crackle),
    (5) FRLL (6) FLLL 3) 건성수포음(rhonchi),
    right lower lung left lower lung 4) 천명(wheezing),
    Back view 9) 판독 불가(cannot analyze)
    (7) BLUL (8) BRUL  
    left upper lung right upper lung  
    (9) BLML (10) BRML  
    left mid lung right mid lung  
    (11) BLLL (12) BRLL  
    left lower lung right lower lung  
     
    [순환기계-청진음] 호흡음 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 study_date string Y 데이터 생성일자   yyyyMMdd
    2 patient_id string Y 환자 ID (비식별화)    
    3 respiratory_files array array of object Y 호흡음 파일 정보    
      3-1 id string Y 호흡음 파일 식별자    
    3-2 file_name string Y 호흡음 파일 이름    
    3-3 location string Y 호흡음 수집 위치 FRUL, FLUL, FRML, FLML, FRLL, FLLL, BRUL, BLUL, BRML, BLML, BRLL, BLLL  
    3-4 label integer Y 호흡음 카테고리 0,1,2,3,4,9 0:정상(normal)
    1:거친수포음 (coarse crackle),
    2:천명(wheezing),
    3:가는수포음 
    (fine crackle),
    4:건성수포음
    (rhonchi),
    9:판독불가
    {
    "patient_id": "1234567",
    "study_date": “20190917”,
    "respiratory_files": [
    [
    {
    "id": "rs_00001_01_BLLL",
    "file_name": "rs_00001_01_BLLL.wav",
    "location": "BLLL",
    "label": 1
    }
    ],
    [
    {
    "id": "rs_00001_01_BLUL",
    "file_name": "rs_00001_01_BLUL.wav",
    "location": "BLUL",
    "label": 1
    }
    ],
    [
    {
    "id": "rs_00001_01_BRLL",
    "file_name": "rs_00001_01_BRLL.wav",
    "location": "BRLL",
    "label": 1
    }
    ],
    [
    {
    "id": "rs_00001_01_BRUL",
    "file_name": "rs_00001_01_BRUL.wav",
    "location": "BRUL",
    "label": 1
    }
    ]
    ]
    }
     
    [순환기계 및 호흡기계 유관데이터] 흉부 X선 구성
    [순환기계 및 호흡기계 유관데이터] 흉부 X선 구성 및 어노테이션 포맷
    원시/원천데이터 심장 및 폐 어노테이션
    흉부 X선 이미지 1: 심장 영역 bounding box
    2. 폐 영역 bounding box
     
    [순환기계 및 호흡기계 유관데이터] 흉부 X선 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 id string Y 흉부 X선 이미지 식별자    
    2 file_name string Y 흉부 X선 이미지 파일명    
    3 width number Y 이미지 가로 크기 (픽셀)    
    4 height number Y 이미지 세로 크기 (픽셀)    
    5 study_date string Y 생성일자   yyyyMMdd
    6 patient_id string Y 환자 ID (비식별화)    
    7 bounding_boxes array of object Y bounding box 정보    
      7-1 bbox_id integer Y bounding box 카테고리 [1,2] 1:심장 영역, 
    2:폐 영역 
    7-2 bbox_name string Y bounding box 이름 heart, lung   
    7-3 type string Y 어노테이션 타입 bounding_box  
    7-4 upper_left array of number Y b-box 좌상단 x,y 좌표    
    7-5 bottom_right array of number Y b-box 우하단 x,y 좌표    
    {
    "id": "rscxr_00001_01",
    "file_name": "rscxr_00001_01.jpg",
    "patient_id": "1234567",
    "study_date": "20190909",
    "width": 100,
    "height": 200,
    "bounding_boxes": [
    {
    "bbox_id": 1,
    "bbox_name": "heart",
    "type": "bounding_box",
    "upper_left": [
    1,
    2
    ],
    "bottom_right": [
    3,
    4
    ]
    },
    {
    "bbox_id": 2,
    "bbox_name": "lung",
    "type": "bounding_box",
    "upper_left": [
    5,
    6
    ],
    "bottom_right": [
    7,
    8
    ]
    }
    ]
    }
     
    [순환기계 유관데이터] 심전도 구성
    [순환기계 유관데이터] 심전도 구성 및 어노테이션 포맷
    원시/원천데이터 심전도 파형 어노테이션
    심전도 파형 이미지 label: 1 
    - 4종의 심전도 파형 인덱스 중 하나 (1-4)
     
    <심전도 파형 4종>
    1) Sinus rhythm (SR)
    2) Atrial fibrillation (AFIB),
    3) Bundle branch block (BBB)
    4) Others

     

    [순환기계 유관데이터] 심전도 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 id string Y 심전도 데이터 식별자    
    2 file_name string Y 심전도 데이터 파일명    
    3 study_date string Y 데이터 생성일자   yyyyMMdd
    4 patient_id string Y 환자 ID (비식별화)    
    5 labels integer Y 심전도 파형 카테고리 [1,4] 1:Sinus rhythm (SR),
    2:Atrial fibrillation (AFIB),
    3:Bundle branch block (BBB),
    4:Others
    {
    "id": "hsecg_00001_01",
    "file_name": "hsecg_00001_01.jpg",
    "patient_id": "1234567",
    "study_date": “20190917”,
    "labels": 1
    }

     

    [순환기계 유관데이터] 혈압 구성
    [순환기계 유관데이터] 혈압 구성 및 어노테이션 포맷
    원시/원천데이터 혈압데이터 어노테이션
    혈압 수치 데이터 해당없음
     
    [순환기계 유관데이터] 혈압 어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 id string Y 혈압 데이터 식별자    
    2 file_name string Y 혈압 데이터 파일명    
    3 study_date string Y 데이터 생성일자 yyyyMMdd  
    4 patient_id string Y 환자 ID (비식별화)    
    5 sbp number Y 수축기 최고 혈압 측정치로 범위없음  
    6 dbp number Y 이완기 최저 혈압 측정치로 범위없음  
    {
    “id”: “hsbp_00001_01”,
    “filename”: “hsbp_00001_01.csv”,
    “study_date”: “20190917”,
    “patient_id”: “1234567”,
    “sbp”: 130,
    “dbp”: 80,
    }

     

  • 데이터셋 구축 담당자

    수행기관(주관) : 연세대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    장혁재 02)2227-9551 [email protected] 총괄 책임 / 데이터 수집, 정제, 가공 및 사업총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    주식회사 온택트헬스 데이터 정제, 가공
    순천향대학교 산학협력단 데이터 수집, 가공
    ㈜데이터웨이 데이터 검수
    주식회사 스마트사운드 데이터 수집
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    장혁재 02)2227-9551 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.