※본 데이터는 원본에서 무작위로 추출된 특성으로 구축된 합성데이터이며, AI허브 약관과 개인정보보호법에 의해 제3자 이전이나 원본데이터의 추론은 엄격하게 금지됩니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3 2024-10-30 최종데이터 추가 개방 메타데이터 1.2 2024-10-30 데이터 최종 개방 1.1 2024-08-09 非안심존 데이터 전환 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-08-27 구축활용가이드, 담당자 정보 변경 2024-06-28 산출물 공개 Beta Version 소개
- 본 데이터 세트는 145,140장의 구도별 구강 합성이미지(PNG)와 그에 대한 충치 치아 및 치아 경계 어노테이션(JSON) 정보를 포함하는 라벨데이터(JSON)파일 145,140개 그리고, 임상적 치열 복잡도 분류 기준에 따른 카테고리 정보를 메타데이터(JSON) 파일 1개로 구성되어있다.
구축목적
- 구축된 합성 데이터세트는 실제 환자들의 다양한 증례를 반영하며, 충치와 치아 경계에 대한 정확한 어노테이션을 통해 모델의 학습과 평가에 유용한 자료로 기여할 것으로 기대된다.
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 PNG 데이터 출처 치과진료를 위한 임상 검사 목적의 이미지 라벨링 유형 치아 경계 : 세그멘테이션, 충치 유무 : classification 라벨링 형식 json 데이터 활용 서비스 충치 및 치아 경계 감지 모델 학습 및 평가 데이터 구축년도/
데이터 구축량2023년/구강합성 이미지 (png) 145,140장 라벨데이터 (json) 145,140장 메타데이터 (json) 1건 -
- 데이터 분포: 합성데이터 생성시, 충치 레이블에 해당하는 데이터가 다른 레이블에 비해 부족한 경우를 고려하였고, 임상적 치열 복잡도 분류 기준을 반영하였다. 이를 활용하여 모델이 구강 상태를 더 정확하게 이해하고 학습하고, 다양한 환자들의 구도와 상태를 반영하도록 구성
데이터 분포 충치별 분포 촬영 각도별 분포 치열 복잡도 분포 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 모델
- 모델 학습: 생성된 합성 데이터를 이용하여 치아 경계와 개별 치아의 충치 데이터를 학습하여 AI 모델을 생성함.- 서비스 활용 시나리오
- 개별 치아 식별 및 치과 보조 서비스
· 구축한 모델을 이용하여 치아 경계를 획득하고 치아 번호를 확인하는데 사용할 수 있는 서비스
· 개별치아의 충치 여부를 확인하여 RGB 이미지를 활용한 스크리닝 서비스
· 다른 서비스와 연동하여 RGB 이미지 상에서 발견한 특이점이 어떤 치아에 번호인지 확인할 수 있는 서비스
· X-ray 이미지와 혼합 사용하여 X-ray와 RGB 이미지 사이에서의 충치 탐색을 크로스 체크 할 수 있는 서비스 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 데이터 종류 설명 형식 이미지 장 수 구강 합성 이미지 구도별 구강 이미지 전체 .png 145,140 라벨데이터 충치 치아 라벨 및 치아 segmentation .json 145,140 메타데이터 임상적 치열 복잡도 분류 기준에 의한 카테고리 .json 1 complexity: none to mild/moderate/severe - 이미지 데이터 구성
이미지 데이터 구성 구도 충치 정상 총 합 front 4,836 15,104 19,940 left 9,057 13,053 22,110 lower 35,632 10,846 46,478 right 8,991 13,339 22,330 upper 23,232 11,050 34,282 총 합 81,748 63,392 145,140 - 구강 합성 이미지 데이터 포멧
구강 합성 이미지 데이터 포멧 구도 FRONT, LEFT, LOWER, RIGHT, UPPER 사이즈 원본 동일한 FHD 이하 사이즈로 구성 (1920*708) 구도별 구강 합성 이미지 예시 front left lower right upper - 라벨데이터 포멧
라벨데이터 포멧 속성명 타입 설명 범위 값 비고 image_filepath string 파일명 tooth object teeth_num number 치아번호 11 ~ 16 치과임상에서 사용하는 FDI 명명법 21 ~ 26 31 ~ 36 41 ~ 46 segmentation array segmentation정보 decayed string 충치정보 T or F 충치있는치아: T 충치없는치아: F - 메타데이터 포멧
메타데이터 포멧 속성명 타입 설명 범위 값 비고 info array image_filepath string 파일명 complexity number 치열 복잡도 1, 2, 3 1: non to mild 2: moderate 3: severe - 라벨데이터 json 실제 예시
- 메타데이터 json 실제 예시
-어노테이션 출력 예시
어노테이션 출력 예시 구도 구강합성 이미지 front left lower right upper -
데이터셋 구축 담당자
수행기관(주관) : 서울대학교치과병원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 양일형 02-6256-3242 [email protected] 사업 총괄 관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 가천대학교 산학협력단 서버 및 인공지능 고성능 컴퓨팅 자원 지원 경북대학교치과병원 데이터 제공 및 라벨링 검수 국립암센터국제암대학원대학교 산학협력단 모델 학습을 위한 학습 데이터 가공
분할정복 생성모델 알고리즘 검증
합성데이터 가공 검증단국대학교 천안캠퍼스 산학협력단 데이터 제공 및 라벨링 검수 디디에이치㈜ 합성데이터 생성 및 검증을 위한 데이터 라벨 가공 및 검수
시범서비스 모델 개발원광대학교 산학협력단 데이터 제공 및 라벨링 검수 한양대학교 산학협력단 데이터 제공 및 라벨링 검수 한양대학교 에리카 산학협력단 분할정복 생성모델 알고리즘 단계별 구현
합성 데이터 생성
분할정복 생성모델 알고리즘 재생산 및 최적화㈜호아솔루션 외부 치과의사 최종검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 강하예진 031-920-0654 [email protected] 고동엽 02-742-1704 [email protected] AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 강하예진 031-920-0654 [email protected] 고동엽 02-742-1704 [email protected] 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 강하예진 031-920-0654 [email protected] 고동엽 02-742-1704 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.