열화상 체온정보
- 분야헬스케어
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-18 데이터 최초 개방 소개
열화상 카메라를 통해 인식되는 대상의 체온과 성별, 연령, 외형, 패션 등을 포함한 이미지 데이터
구축목적
코로나19 및 전염병 발열측정 기기로 활용되고 있는 고성능, 중성능, 저성능 열화상 카메라의 정확도를 높이기 위한 AI 온도보정기술 개발
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/4.8만 -
구축 내용 및 제공 데이터량
- 열화상체온정보 AI 데이터는 환경정보, 객체정보, Technical 정보가 포함된 데이터로 고/중/저성능 데이터 485,987개로 목표(450,000개) 대비 108% 초과 구축함
구축 내용 및 제공 데이터량 표 구 분 2021년 목표(A) 구축(B) 달성률(B/A) 데이터셋 고성능 347,000 357,989 103.2% 중성능 60,000 73,863 123.1% 저성능 25,000 29,466 117.9% 소계 432,000 461,318 106.8% Pairing Data 고성능-실측치 3,000 3,189 106.3% 중성능-고성능 10,000 16,363 163.6% 저성능-고성능 5,000 5,117 102.3% 소계 18,000 24,669 137% 총계 450,000 485,987 108%
- 열화상체온정보 AI 데이터는 환경정보, 객체정보, Technical 정보가 포함된 데이터로 고/중/저성능 데이터 485,987개로 목표(450,000개) 대비 108% 초과 구축함
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 온도 에측 모델2(고성능) Object Detection Random Forest Regression MAPE 5 % 0.12 % 2 온도 에측 모델2(고성능) Object Detection Random Forest Regression MAPE 5 % 0.12 % 3 온도 에측 모델2(고성능) Object Detection Random Forest Regression MAPE 5 % 0.12 % 4 온도 예측 모델(고성능) Object Detection CNN, DNN RMSE 0.9 mm 0.483 mm 5 온도 예측 모델(증성능) Object Detection CNN, DNN RMSE 0.7 mm 0.551 mm 6 온도 예측 모델(고성능) Object Detection CNN, DNN RMSE 3.1 mm 0.296 mm
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 코로나19 및 전염병 발열측정 기기로 활용되고 있는 고성능, 중성능, 저성능 열화상 카메라의 정확도를 높이기 위한 AI 온도보정기술 개발
활용 분야
- 서비스 사업화 및 지속적인 데이터 확보로 체온분야 AI 학습데이터 생태계 선순환 창출
소개
- 1) 데이터 설계 : 객체 및 환경에 대한 카테고리 분류 정의
- 촬영장소 및 환경 등 구분하여 객체 분류
- 상황 기반 Annotation 구조 구축 - 2) 데이터 수집 : 초상권 등 법적 문제를 해결한 원천 데이터 수집
- 촬영 정보에 대해 학습용 자료로 사용하기 위한 반출의 법적 근거 확보 - 3) 데이터 정제 : 부적합 데이터 제거
- 오차가 심한 불용한 데이터 제거 - 4) 데이터 가공 : 이미지 내 정보를 label로 연결
- 촬영된 열화상 이미지와 식별된 온도 등으로 labeling 작업 실행 - 5) 데이터 검증 : 데이터셋의 다양성/정확성/유효성 검증
- 탐지할 객체의 바운딩 박스가 정확한지 확인하고 데이터셋의 유효성 검증
- TTA 가이드 라인을 따라 검증 저작 도구를 사용하여 데이터의 품질 검증
구축 내용 및 제공 데이터량
- 열화상체온정보 AI 데이터는 환경정보, 객체정보, Technical 정보가 포함된 데이터로 고/중/저성능 데이터 485,987개로 목표(450,000개) 대비 108% 초과 구축함
구축 내용 및 제공 데이터량 표 구 분 2021년 목표(A) 구축(B) 달성률(B/A) 데이터셋 고성능 347,000 357,989 103.2% 중성능 60,000 73,863 123.1% 저성능 25,000 29,466 117.9% 소계 432,000 461,318 106.8% Pairing Data 고성능-실측치 3,000 3,189 106.3% 중성능-고성능 10,000 16,363 163.6% 저성능-고성능 5,000 5,117 102.3% 소계 18,000 24,669 137% 총계 450,000 485,987 108%
대표도면
필요성
- 코로나 19 등의 감염병과 관련하여 질병의 발견을 위해 학교 등의 다중이용 시설에서 출입자의 온도를 열화상 카메라로 측정하고 있음
- 하지만 모니터링하는 단계에만 그쳐 연관된 데이터를 저장하지 않음
- 이런 열화상 이미지, 주변 온도 등 기타 체온에 영향을 줄 수 있는 요소를 데이터화 하여 열화상 이미지 데이터를 구축하는 것이 필요
- 사람 출입이 많은 시설에서는 열화상 카메라를 사용하여 동시에 여러명의 체온을 측정하고 있지만, 성능이 좋은 열화상 카메라는 고가여서 보편화하기 힘들고 저렴한 열화상 카메라는 정확한 체온을 측정하는데 주변 온도, 거리, 복장 상태 등 많은 외적 요소의 영향을 받음
- 기존 체온계는 한 번에 한 사람만 측정할 수 있으며 체온 측정을 위해 인력이 투입되어야 하며 체온측정 담당자는 감염 위험에 노출됨
데이터 구조
- 데이터 구성
- 열화상이미지(JPG) + 객체 별 가공 데이터(JSON) → zip 파일로 압축시켜 제공
- 이미지 데이터의 수량으로 인해 zip파일의 형태로 압축되며, 일자 별 폴더 내의 열화상 이미지와 meta 데이터(환경, 객체, Technical 정보가 포함)는 JSON포맷의 구조로 되어 있음
- 어노테이션 포맷
어노테이션 포맷 표1 No 항목명(영어) 항목명(한글) 설명 타입 필수여부 1 image_id 이미지아이디 이미지를 구분하기 위한 값 String Y 2 environmental_
factors환경속성 주변 환경에 대한 정보 Object N
2-1 place 장소 데이터가 수집된 장소
(A1 : 베이넥스,
B1~B3 : 아이튼,
C1: 건국대학교병원,
D1 : 국제문화기술진흥원,
E1 : 글로벌사이버대학교
산학협력단,
F1 : 파주 종합복지관,
G1 : 파주 장애인
주간보호시설,
H1 : 원흥 아이랜드 어린이집String Y 2-2 camera_type 카메라성능 카메라 성능 정보
(H : 고성능,
M : 중성능,
L : 저성능)String Y 2-3 day 일자 년월일 정보
(yyyymmdd로 구성)String Y 2-4 hms 시간 시간(시분초) 정보
(hhmmss로 구성)String Y 2-5 image_type 이미지유형 이미지 유형 정보
(T : 열화상 이미지,
R : 실화상 이미지)String Y 2-6 temp_inside 실측온도 실내 측정 온도(단위 : ℃) Float Y 2-7 temp_outside 기상온도 기상온도(단위 : ℃) Float Y 2-8 humid_inside 실측습도 실내 측정 습도(단위 : %) Float Y 2-9 humid_outside 기상습도 기상 습도(단위 : %) Float Y 2-10 illumination 조도 조도에 대한 정보(단위 : Lux) Integer N 2-11 wind 바람 바람에 대한 정보(단위 : m/s) Float N 3 individual_factors 객체 속성 사람(객체)에 대한 정보 List Y
3-1 camera_temp 카메라 측정 온도 인체 체온(단위 : ℃) Float Y 3-2 individual_temp 실측 온도 고성능 : 고막체온계 실측 온도
중성능 : 고성능 카메라 온도
저서응 : 고성능 카메라 온도Float N 3-3 distance 거리 거리에 대한 정보(단위 : m)
(1m, 2m, 3m, 4m, 5m)Integer Y 3-4 bbox 바운딩박스 사람 얼굴의 위치 좌표
이미지의 좌측 상단을
기준으로 [left,
top, width, height]
값을 가짐List Y 3-5 optional 부가속성 사람에 대한 추가 정보 Object Y
3-5-1 age 연령 나이대 그룹
(child : 유아,
youth : 청소년/청년,
middle-age : 중장년,
old-age : 노년)String Y 3-5-2 gender 성별 성별 (male : 남자,
female : 여자)String Y 3-5-3 tail 외형(키) 외형(키)
(120_under : 120cm이하,
120-180 : 120cm초과
180cm이하,
180_over : 180cm초과)String Y 3-5-4 body_type 외형(체형) 외형(체형)
(slim : 마른체형,
normal : 평균체형,
fat : 살찐체형)String Y 3-5-5 mask_exists 마스크유무 마스크유무
(true : 착용,
false : 미착용)Boolean Y 3-5-6 is_short_sleeve 반팔/긴팔 반팔 착용 유무
(true : 착용,
false : 미착용)Boolean Y 3-5-7 outer_exists 아우터유무 아우터 착용 유무
(true : 착용,
false : 미착용)Boolean Y 4 technical_factors Technical 속성 테크니컬 요소에 대한 정보 Object N
4-1 model 카메라 모델명 열화상 카메라 종류별 모델명 String Y 4-2 bbody_temp 블랙바디 온도 블랙바디 설정 온도(단위 : ℃) String N 4-3 bbody_
emissivity블랙바디 방사율 블랙바디 방사율 String N 4-4 resolution 열화상해상도 열화상해상도에 대한 정보 String Y 4-5 range_of_
spectrum스펙트럼 범위 스펙트럼 범위(단위 : µm) String Y 4-6 netd NETD 노이즈 등가 온도차 String Y 4-7 temperature_
range측정온도 범위 카메라의 측정온도 범위 String Y 4-8 temperature_
accuracy측정온도 오차범위 카메라의 측정온도 오차 범위 String Y
-
데이터셋 구축 담당자
수행기관(주관) : 베이넥스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 채정환 02-785-9977 [email protected] · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 (주)아이든 · 데이터 검증
· 응용서비스 개발건국대학교병원 · 데이터 수집
· 구축 기준점 마련 및 의학 자문(사)국제문화기술진흥원 · 크라우드 소싱
· 데이터 정제, 가공글로벌사이버대학교 산학협력단 · AI 데이터 모델링 개발
· 데이터 정제, 가공데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 전우정(베이넥스) 02-785-9977 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.