-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2023-02-22 원천데이터, 라벨링데이터 수정 1.1 2021-11-04 데이터 추가 개방 1.0 2021-06-30 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
실내 자율주행 로봇 관점의 주행 환경 영상기반 학습용 데이터
구축목적
국내 자율주행 로봇에 대한 산업적 수요 증대와 국내 환경에 적합한 자율주행 로봇 서비스 가능 산업 활성화를 위해 로봇의 이동 중 직면 가능한 장애물 정보에 대한 데이터 구축 필요 공간 및 인간과의 접점 수준과 수송역량을 기반하여 일상생활 환경에서 제공 가능한 로봇 서비스와 주요 산업시설에서의 자율주행 로봇 서비스에 기반하여 로봇의 기능 및 임무 수행 범위가 고려된 주행영상 데이터 수집
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 비디오 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/72.6만 -
구축 내용 및 제공 데이터량
- 데이터셋은 자율주행 로봇이 실내외 환경에서 안정적인 주행이 가능하도록 주행에 방해되는 객체정보 및 대표적인 자율주행 로봇 서비스를 고려한 실증 운행 기반의 객체를 정의하고 자율주행 로봇의 안정적 주행 데이터 수집
- 국내 시설물을 활용하여 다양한 주행 환경에서의 객체정보를 포함한 일반상황과 서비스를 고려한 특수상황에 대한 데이터로 일반상황의 경우 500시간, 특수상황의 경우 100시간의 영상 데이터로 구성
- 100시간의 특수상황 영상 데이터 중 10시간은 고정밀 3D 스캔 장비를 활용하여 포인트 클라우드 기반의 공간구축데이터를 구축 - 실내·외 자율주행 환경에서 영상학습 기반의 라벨링 된 장애물 자동 검출, 장애물 회피·추적을 위해 특수상황의 경우, 자율주행 방식 중 자율, 대열 주행 시에는 범용적으로 데이터 활용이 가능하나, 추종 주행 시에는 추종자에 대한 객체정보가 상이함으로 제약상황 발생할 수 있음을 고려한 시나리오 기반 데이터 구축
구축 내용 및 제공 데이터량 표 구분 구축량
(시간 / 건)제공 방식 '일반상황' 로봇 관점 주행 영상 514 / 1,028 라벨링이 된 영상(4K 및 Full HD, 10FPS)과
라벨링 결과(JSON 파일) set'특수상황' 로봇
관점 주행 영상자율주행 로봇 주행 영상 91 / 182 3D 스캐너 영상 데이터 11 / 1
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 ROC Curve Image Classification CNN AUC-ROC 0.9 단위없음 1 단위없음
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2021.11.04 데이터 추가 개방 1.0 2021.06.30 데이터 최초 개방 구축 목적
- 국내 자율주행 로봇에 대한 산업적 수요 증대와 국내 환경에 적합한 자율주행 로봇 서비스 가능 산업 활성화를 위해 로봇의 이동 중 직면 가능한 장애물 정보에 대한 데이터 구축 필요
- 공간 및 인간과의 접점 수준과 수송역량을 기반하여 일상생활 환경에서 제공 가능한 로봇 서비스와 주요 산업시설에서의 자율주행 로봇 서비스에 기반하여 로봇의 기능 및 임무 수행 범위가 고려된 주행영상 데이터 수집
활용 분야
- 본 사업을 통해 구축된 로봇 관점 주행 영상 AI데이터는 자율주행 로봇이 출발지점부터 목적지까지 충돌이 발생할 수 있는 객체는 인식하고 안전하게 도착할 수 있는 학습용 데이터로 활용이 가능하며, 이를 통해 실내외 환경에서 강건한 자율주행이 가능한 로봇 개발에 기여함
소개
- 인공지능 로봇에 탑재되는 자율주행 성능의 향상과 해외 기술선도국가 간의 기술격차 해소를 위해서는 국내 환경에 적합한 양질의 인공지능 학습데이터 구축이 최우선으로 요구
- 국내 실내·외 환경에서 로봇이 자율주행을 하기 위해 출발지점부터 목적지까지 충돌이 발생할 수 있는 객체를 인식하고 안전하게 도착할 수 있는 학습용 영상 데이터셋으로 흥일기업(주)에서 구축하였으며, 본 데이터는 실내·외 600시간의 영상 데이터로 구성
- 국내·외 로봇 관점 데이터는 자율주행 영상 데이터 구축사례가 없으며, 본 영상 데이터는 자율주행 로봇 산업 전반의 활용 분야에서 사용 가능
- 영상 데이터는 자율주행 로봇 서비스 가능 산업의 공간 및 인간과의 접점 수준과 수송역량을 분석하여 활용 가능한 분야 및 자율주행 로봇의 기능 및 임무 수행 범위를 고려하여 의료 시설, 산업 시설, 서비스 시설로 분류하여 데이터 구축
- 서비스 자율 주행 로봇과 타 객체 간의 일어날 수 있는 안전 사고의 위험성을 저감시키며, 자율주행 로봇 개발상의 편의성, 정확성, 다양한 정보 제공 목표
구축 내용 및 제공 데이터량
- 데이터셋은 자율주행 로봇이 실내외 환경에서 안정적인 주행이 가능하도록 주행에 방해되는 객체정보 및 대표적인 자율주행 로봇 서비스를 고려한 실증 운행 기반의 객체를 정의하고 자율주행 로봇의 안정적 주행 데이터 수집
- 국내 시설물을 활용하여 다양한 주행 환경에서의 객체정보를 포함한 일반상황과 서비스를 고려한 특수상황에 대한 데이터로 일반상황의 경우 500시간, 특수상황의 경우 100시간의 영상 데이터로 구성
- 100시간의 특수상황 영상 데이터 중 10시간은 고정밀 3D 스캔 장비를 활용하여 포인트 클라우드 기반의 공간구축데이터를 구축 - 실내·외 자율주행 환경에서 영상학습 기반의 라벨링 된 장애물 자동 검출, 장애물 회피·추적을 위해 특수상황의 경우, 자율주행 방식 중 자율, 대열 주행 시에는 범용적으로 데이터 활용이 가능하나, 추종 주행 시에는 추종자에 대한 객체정보가 상이함으로 제약상황 발생할 수 있음을 고려한 시나리오 기반 데이터 구축
구축 내용 및 제공 데이터량 표 구분 구축량
(시간 / 건)제공 방식 '일반상황' 로봇 관점 주행 영상 514 / 1,028 라벨링이 된 영상(4K 및 Full HD, 10FPS)과
라벨링 결과(JSON 파일) set'특수상황' 로봇
관점 주행 영상자율주행 로봇 주행 영상 91 / 182 3D 스캐너 영상 데이터 11 / 1
대표도면
- 장소(산업시설, 의료시설, 주거시설 등)에 따른 영상데이터 취득
- 시나리오 기반 영상데이터 취득
필요성
- 자율주행 기술 개발에는 데이터의 축적이 필수적으로 요구되나, 기업·대학 등이 개별적으로 데이터 확보함으로써 원천적으로 부족한 데이터 양 문제를 해결하고 데이터를 상호 공유하는 것에 비해 산·학·연의 연계성이 부족한 문제를 충족시키기 위해 로봇 관점의 영상데이터 필요
- 자율주행 기술 개발시 데이터의 규모를 확대하는 등 데이터 공유사업을 내실화하여 자율주행을 위한 데이터를 수집하여 인공지능(AI)으로 학습할 수 있는 형태의 가공 및 공유로 산업에 대한 파급력 향상 가능성 제고
- 서비스 로봇 산업 시장의 규모가 확대되면서 규제 개선 및 실증을 추진하고 있으며, 국내 실내·외 환경에서 자율주행 로봇에 로봇이 자율주행을 하기 위해 출발 지점부터 목적지까지 충돌이 발생할 수 있는 객체를 인식하고 안전하게 도착할 수 있는 학습용 영상데이터 확보 필요
- 국내 수준에서는 자율주행 로봇 관점을 활용한 데이터 구축사례가 전혀 없으며 국내 자율주행 로봇을 구현하기 위해서는 실제 환경의 데이터 구축을 통한 학습 필요
- 안전한 자율주행을 위해서는 정확한 데이터 셋 구축을 통해 자율주행에 있어 안전성, 정확성, 정밀도 등 확보할 수 있는 기반 마련 수행 ㅇ 로봇이 자율주행 시 사람과, 사물 등 사고를 저감할 수 있는 안전한 주행을 위해 위치추정과 경로생성 등 데이터 필요
데이터 구조
- 데이터셋 저장 구조
- 데이터셋 구조
- 데이터 파일명 코드 규칙
데이터 파일명 코드 규칙 대분류 중분류 소분류 분류상세 구분 코드 분류 구분 코드 분류 구분 코드 분류 일반 상황 다중 이용 시설 N 교육 시설 E 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 지자체 관리 시설 L 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 전시 시설 M 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 주택 밀집 단지 H 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 공원 P 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 기타 지역 ETC 물류 이송 및 시설물 관리 관점 로봇 서비스 주행 1,2,3, ... 이동경로 라벨링
(Poly Line)PL 이동경로 POLYLINE 레이블링 1,2,3, ... 특수 상황 주요 산업 시설 S 의료 시설 H 간병지원 로봇 서비스 주행 1,2,3, ... 원격회진 로봇 서비스 주행 의료품 배달 로봇 서비스 주행 입원침대형 로봇 서비스 주행 휠체어 로봇 서비스 주행 청소 로봇 서비스 주행 안전 로봇 서비스 주행 3D 스캐너를 통한 공간정보 산업 시설 I 산업 안전 로봇 서비스 주행 1,2,3, ... 물품이송 로봇 서비스 주행 보안 경리 로봇 서비스 주행 청소 로봇 서비스 주행 서비스 시설 S 안내 로봇 서비스 주행 1,2,3, ... 수거 정리 로봇 서비스 주행 청소 로봇 서비스 주행 안전 관리 로봇 서비스 주행 보안 경비 로봇 서비스 주행
- 어노테이션 포맷-바운더리 박스(B-Box)
- 바운더리 박스의 json 파일 구조는 정의하고자 하는 객체의 속성정보가 나열되고 라벨링 이미지의 정보 나열(영상 1개당 600장의 이미지를 추출하여 사용하기 때문에 600장의 이미지 정보가 나열)
- 이미지 정보 뒤에 바운더리 박스에 대한 정보 나열
- 바운더리 박스의 좌표정보는 4개로 나타내며, 각각 x, y, width, height로 나타냄
- 이 외에 박스의 상세정보가 표기되는데 객체가 일부 가려졌는지에 대한 설정 등에 대한 작업시 설정했던 상태를 보여줌
<어노테이션 도구를 이용한 B-Box 작업>
< B-Box JSON 파일 해석>
- 어노테이션 포맷-폴리라인(Polyline)
- 폴리라인의 json 파일 구조도 바운더리 박스의 구조와 흡사
- 처음에 정의하고자 하는 객체의 속성정보가 나열되고 라벨링 이미지의 정보가 나열됨(본 과제에서는 영상 1개당 600장의 이미지를 추출하여 사용하기 때문에 600장의 이미지 정보가 나열)
- 이미지 정보 뒤에 폴리라인 라벨링에 대한 정보가 나열됨(폴리라인 좌표: 점좌표)
- 폴리라인 점좌표 이후에 점좌표가 포함된 경계 박스의 좌표가 나타남
- 박스의 좌표정보는 4개로 나타내며, 각각 x, y, width, height로 나타냄
- 폴리라인에 경계박스 좌표가 존재하는 이유는 COCO의 특성으로, 폴리라인에 대한 좌표를 탐색할 때 경로 계산에서 속도를 높이기 위함으로 판단 됨
- 경계 박스 좌표는 폴리라인 좌표 추적에 사용하기 위함이므로 실제로 이미지에 바운더리 박스 라벨링으로 표시되지 않음
< Polyline JSON 파일 해석>
-
데이터셋 구축 담당자
수행기관(주관) : 흥일기업
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박성진 02-6283-0165 [email protected] · 데이터 구축 컨소시엄 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 (주)디타스 · 원시 데이터 2차 정제 및 가공, 어노테이션 순천향대학교 산학현력단 · 데이터 검수 및 품질관리 동의대 산학협력단 · AI 요약 모델 개발 및 적용, 응용 서비스 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 권용빈 02-6283-0165 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.