※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-30 데이터 최초 개방 소개
모발이식 및 결과 예측에 활용하기 위한 두피 모발 확대 영상 데이터
구축목적
AI도입을 통한 탈모산업의 발전, 정확한 치료계획 수립 및 효율적 치료를 위한 인공지능을 훈련하기 위한 데이터셋
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/2.5만 -
구축 내용 및 제공 데이터량
- 두피 확대 영상기반 모발밀도 이미지와 각 모발의 모공을 중심으로 하여 해당 모낭의 모발 개수를 분류한 어노테이션 데이터 5,000장
- 모발이식수술 전과 모발이식수술 후의 얼굴형태 이미지와 모발의 영역(전체, 수술부위)을 어노테이션한 데이터 21,364장
구축 내용 및 제공 데이터량 구축 내용 구축량 두피 확대 영상기반 모발 밀도 데이터 두피 확대 영상 기반으로 모발의 밀도를 측정하고 모발을 각 class별로 구분된 데이터 구축 1,000case/5,000장 모발 이식결과 예측을 위한 수술 전/후 데이터 모발 이식결과 예측을 위해 모발 이식 수술 전과 모발 이식 수술 후의 영상 내 범위 데이터 구축 2,500case/ 21,364장 -
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 모발밀도 측정 알고리즘 검증 Estimation YOLO v4 AccuracyTop-1 80 % 84.49 % 2 모발밀도 측정 알고리즘 검증 Estimation YOLO v4 AccuracyTop-2 90 % 96.49 % 3 모발이식수술 결과 예측 알고리즘 검증 Prediction CycleGAN Accuracy 75 % 96.4 % 4 모발이식수술 결과 예측 알고리즘 검증 Prediction CycleGAN Precision 75.6 % 99.7 % 5 모발이식수술 결과 예측 알고리즘 검증 Prediction CycleGAN Recall 73.7 % 93 % 6 모발밀도 측정 알고리즘 검증 Estimation YOLO v4 RMSE 0.786 mm 0.35 mm
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.30 데이터 최초 개방 구축 목적
- AI도입을 통한 탈모산업의 발전, 정확한 치료계획 수립 및 효율적 치료를 위한 인공지능을 훈련하기 위한 데이터셋
활용 분야
- 모발이식수술 후 예상 서비스, 모발밀도 측정 서비스 등
소개
- 실제 의료현장에서 수집한 이미지 데이터를 정제, 가공하여 데이터 구축
- 모발밀도 데이터셋 : 모낭의 개수 및 모낭 하나당 모발의 수를 측정할 수 있도록 두피 모발 확대 영상을 모낭 별로 모발의 수를 4가지 class type으로 분류한 데이터이며, 성별, 연령대 등 메타데이터를 포함
- 모발이식수술전후 데이터셋 : 모발 이식 결과 예측을 위해 모발 이식 수술 전과 후의 영상 내 전체 모발 및 수술 부위 범위를 어노테이션한 데이터이며, 성별, 연령대, 탈모 타입등 메타데이터를 포함
구축 내용 및 제공 데이터량
- 두피 확대 영상기반 모발밀도 이미지와 각 모발의 모공을 중심으로 하여 해당 모낭의 모발 개수를 분류한 어노테이션 데이터 5,000장
- 모발이식수술 전과 모발이식수술 후의 얼굴형태 이미지와 모발의 영역(전체, 수술부위)을 어노테이션한 데이터 21,364장
구축 내용 및 제공 데이터량 구축 내용 구축량 두피 확대 영상기반 모발 밀도 데이터 두피 확대 영상 기반으로 모발의 밀도를 측정하고 모발을 각 class별로 구분된 데이터 구축 1,000case/5,000장 모발 이식결과 예측을 위한 수술 전/후 데이터 모발 이식결과 예측을 위해 모발 이식 수술 전과 모발 이식 수술 후의 영상 내 범위 데이터 구축 2,500case/ 21,364장 대표도면
필요성
- 국내의 모발이식 연구사례는 인공지능을 활용해서 두피증상을 진단하는 연구가 있었으나 두피의 머리카락의 특성(두께, 모발 밀도)을 측정하는 것이 아닌 두피 질병 진단을 목표로 진행됨
- 두피 영상을 기반으로 진행된 국내 연구현황은 주로 현미경 영상을 통해 영상처리 기법을 활용하여 두피의 머리카락을 나누고 모발 수를 측정하는 등 인공지능 기반의 연구는 미비한 상황임
데이터 구조
- 모발밀도 영상 포맷
1. 데이터 구성
2. 어노테이션 포맷
어노테이션 포맷 표1 분류 항목 영문명 Type 작성방법 예시 파일
정보아이디 id string "HD_" + CASE ID(5자리) +
"_" + 일련번호(2자리)HD_00001_01,
HD_00123_02파일명 filename string [아이디].jpg HD_00001_01.jpg 저장폴더 path string 홈 디렉토리 기준으로
저장 상대경로Data/HD 해상도 resolution array 가로/세로 픽셀수를 배열로 작성 [4000,2000] 어노테이션 타입 anno_type string 바인딩박스 bbox 성별 gender number 남성: 0, 여성: 1 0 나이 age number 만 나이 기준 40 어노테이션
정보(labels)라벨 아이디 label_id a
r
r
a
ynumber 일련번호 부여 1, 2, 3, ... 클래스 class number 모발 개수 기준 클래 부여 1, 2, 3, 4 좌상단 X좌표 x number 바인딩박스
좌상단 x좌표120 좌상단 y좌표 y number 바인딩박스
좌상단 y좌표250 박스 높이 height number 바인딩박스의 높이 101 박스 넓이 width number 바인딩박스의 넓이 112 - 모발이식수술전후 영상 포맷
1. 데이터 구성
<모발 이식 수술 전/후 데이터 셋 구성>
[ 모발 이식 수술 전/후 데이터 셋 분류 ]
데이터 구성 데이터 수술 전 영상 데이터 수술 후 영상 데이터 수술 후 팔로우 업 영상 데이터 코드 PRE PST FU 2. 어노테이션 포맷
어노테이션 포맷 표2 분류 항목 영문명 Type 작성방법 예시 파일
정보아이디 id string 수술전후 : "SU_" +
CASE ID (5자리) +
"_" + "PRE/PST/FU" +
일련번호(2자리)SU_00001_PRE_01,
SU_00123_PST_02,
SU_00123_FU_03파일명 filename string [아이디].jpg SU_00001_PRE_01.jpg 저장폴더 path string 홈 디렉토리 기준으로
저장 상대경로Data/SU/SU_00001 해상도 resolution array 가로/세로 픽셀수를
배열로 작성[4000,2000] 어노테이션 타입 anno_type string 폴리곤 polygon 성별 gender number 남성: 0, 여성: 1 0 나이 age number 만 나이 기준 40 탈모정도의
의학적 진단hair_type string BASP 분류법에 의거한
type 설명 (1~7단계)1 수술시 식모된
모발의 개수hair_cnt string 모발갯수(Hair count)
혹은 모낭갯수
(follicular unit count)123 약물 복용 유무 take_medicine_
ynstring 무/유 0/1 0 곱슬머리 정도 curly_hair_
grstring 0 직모, 1 mild,
2 moderate, 3 severe1 어노테이션
정보(labels)라벨 아이디 label_id a
r
r
a
ynumber 일련번호 부여 1, 2, 3, ... x좌표 배열 x_array array 폴리곤 X좌표 배열,
구분자는 "|"["1306.99"|"1414.10"|"1543,12"|
"1087.67"|"1107.97"]y좌표 배열 y_array array 폴리곤 y좌표 배열,
구분자는 "|"["1306.99"|"1414.10"|"1543,12"|
"1087.67"|"1107.97"] -
데이터셋 구축 담당자
수행기관(주관) : 경북대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 도영해 053-950-6308 [email protected] · 데이터구축 총괄 · AI 서비스 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 아이엔케이테크놀러지 · 데이터 정제 및 가공 데이터웨이 · 데이터 품질 검증 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 도영해(경북대학교 산학협력단) 053-950-6308 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.