-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-07-25 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-01-12 산출물 전체 공개 소개
연약지반에서 획득된 도로조사용 다중채널 GPR데이터에서 지하시설물 분류(시설물 4종 및 지하공동) 및 바운딩박스를 통한 인공지능 학습용 데이터를 구축함
구축목적
다양한 데이터 분포를 고려한 매립층, 염분이 포함된 해안가 및 연약지반 지역 도로하부 지하시설물 다중채널 GPR 인공지능 학습용 데이터 구축
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 부산시청, 직접취득한 데이터 라벨링 유형 바운딩박스(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 GPR데이터 분석 데이터 구축년도/
데이터 구축량2022년/GPR데이터 이미지와 라벨링데이터 xy평면:108,329개의 이미지와 라벨링데이터 yz평면:103,809개의 이미지와 라벨링데이터 xz평면:101,066개의 이미지와 라벨링데이터 -
표 1 데이터구축 규모 Train Valid Test Total 할당비율 80% 10% 10% 100% xy 86,663 10,833 10,833 108,329 yz 83,047 10,381 10,381 103,809 xz 80,852 10,107 10,107 101,066 표 1 데이터구축 규모
표 2 데이터 통계 표적 데이터형태 최소수량 구축량합계 종단(YZ) 횡단(XZ) 평단(XY) 관로 이미지 105,000 147553 49747 48939 48867 /JSON 박스 이미지 36,000 50098 17020 16545 16533 /JSON 맨홀 이미지 36,000 51038 17903 16575 16560 /JSON 패칭 이미지 24,000 33515 11537 10998 10980 /JSON 지하 이미지 45,000 58250 21388 18429 18433 공동 /JSON 표 2 데이터 통계
1. 데이터 분포
-단면별 분포1. 데이터 분포 -단면별 분포 목표 구성비 종단면(YZ) 33% 횡단면(XZ) 33% 평단면(XY) 33% 표 3 데이터 단면별 분포
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델학습
모델학습 학습(Train) 검증(Validation) 시험(Test) 개요 각 클래스별 정제된 데이터
정확한 라벨링 필요
바운딩박스의 크기 및 위치 확인필요학습도중 모델 성과평가 및 비교 모델학습 완료 후
모델성능 테스트분포 80%(각 평면: 8만개) 10%(각 평면:1만개) 10%(각 평면:1만개) 서비스 활용 시나리오
- 구축한 모델은 각 현업의 GPR탐사 업체에서 분석작업을 적용시킬 수 있음.
- GIS업체의 지하매장시설물의 위치 파악에 중요한 데이터로 활용할 수 있음.
- 안전분야에서 도로의 지하공동을 확인하여, 재난을 미연에 방지하는데 사용할 수 있음.
- 축적된 GPR데이터로 도로의 마모도, 마모경향등을 분석하여, 재포장등의 자료로 사용가능. -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 표적 탐지 성능 Object Detection YOLO v5 mAP@IoU 0.5 70 % 85.76 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드그림 1 파이프를 탐사한 GPR데이터
데이터의 구성. 탐사진행방향을 y축, 현재탐사하는 폭을 x축, 그리고 깊이를 z축으로 하여 3가지 면의 이미지를 추출할 수 있다.
XY 평단면, YZ종단면, XZ횡단면.
한번 탐사할때마다 3가지의 단면이미지가 생성되며, class역시 이 세가지평면 이미지에서 탐지할 수 있다.표 1 어노테이션 포멧 No 이름 타입 필수여부 설명 1 fileName string Y 파일이름 2 targetType string Y 객체분류 3 plane string Y 평면종류 4 prcStep string N 처리단계 5 madeDate string Y 생성일자 6 fileType string N 파일종류 7 annotation object Y 어노테이션 7-1 classes string Y 어노테이션종류 7-2 bbox_id string Y 바운딩박스식별자 7-3 bbox_x string Y 바운딩박스시작점x좌표 7-4 bbox_y string Y 바운딩박스시작점y좌표 7-5 bbox_h string Y 바운딩박스세로길이 7-6 bbox_w string Y 바운딩박스가로길이 7-7 bbox_xM string N 바운딩박스x최대값 7-8 bbox_yM string N 바운딩박스y최대값 8 img_attr object Y 이미지특성 8-1 imgGetTeam string N 이미지획득팀 8-2 imgLoc string Y 이미지위치 8-3 imgDev string Y 이미지개발툴 8-4 imgSrc string Y 이미지소스파일 표 1 어노테이션 포멧
그림 2 JSON파일 실제 예
-
데이터셋 구축 담당자
수행기관(주관) : 이성(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김상욱 031-500-2640 [email protected] 과제 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜스마트뱅크 수집, 정제 ㈜지하공간이엔지 가공 ㈜메이플러스 AI모델
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.