실생활 투명 객체 3D 데이터
- 분야영상이미지
- 유형 3D , 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-05-23 라벨링데이터 수정 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-13 신규 샘플데이터 개방 2022-07-28 콘텐츠 최초 등록 소개
실생활 투명객체 3D 데이터는 실생활에서 사용하는 투명 객체를 선정하고 투명체/비투명체/배경/깊이정보 등 직접 촬영하여 이미지 데이터 셋과 포인트 클라우드와 메쉬(Mesh)로 구성되는 3D 데이터 모델 (3D-Shapes)개로 구성
구축목적
– 원천 데이터로부터 AI 모델 학습, 개발에 활용할 수 있는 데이터셋을 구축 – 구축된 데이터셋을 활용하여 실제 AI 모델을 개발하여 서비스 구현 가능함을 실증 – 투명 객체는 일상생활에서 어렵지 않게 볼 수 있지만, 다량의 투명객체 3D 데이터는 없음. 투명 객체 3D 데이터를 대량으로 구축하여 로봇, 실감 렌더링 기술, 게임 기술, VR/AR/MR 분야에서 활용
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 3D , 이미지 데이터 형식 객체가 1개 이상 포함된, 일상 생활 공간 이미지 20만장(원본) : png, pcd, 객체 500개에 대한 고품질의 3D 모델 데이터 : ply, obj 데이터 출처 RGB-D 카메라 직접 촬영 20만장 라벨링 유형 전면 및 후면 라벨러 라벨링 형식 바운딩 박스, 폴리곤, 큐보이드 데이터 활용 서비스 일상생활 속 다양한 객체들에 대한 대량의 인공지능을 위한 학습데이터 구축을 통해 실감 렌더링 기술, 게임 기술 등의 인공지능 기반 서비스 구축에 활용 데이터 구축년도/
데이터 구축량2021년/구축된 데이터량은 실생활 투명 객체 2D 이미지는 211,484장(30~40GB), 실생활 투명 객체 3D 이미지는 211,527장, 실생활 투명 객체 3D Shape는 500개(20~300GB)로 구성이 되어 있음. -
1. 데이터 구축 규모
-
1. 데이터 구축 규모 데이터 종류 데이터 규모 데이터 크기 데이터셋명 실생활 투명 객체 2D 이미지 가공 211,484장 20~40GB 실생활 투명 객체 3D 이미지 가공 211,527장 30~40GB 실생활 투명 객체 3D Shape 500개 200G ~300B
2. 데이터 분포
- 데이터가 편향 없이 구축되도록 객체 카테고리 설계
- 24개 카테고리, 500개 품목:
- 데이터의 편향성을 방지하기 위해 생활분류별, 재질, 카테고리로 분류하며 병류 165 개, 그릇류 85 개, 1회용 포장류 100 개, 계량용기 30 개, 장식류 28 개, 가구류 28개, 액세서리류 44개, 기타 20 개, 비정상형태 10개로 총 500 객체의 이미지를 수집
- 투명도 측정기를 통해 다양한 투명도를 가진 객체를 대상으로 데이터 수집
-
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 인공지능 데이터 활용 모델 개발 요약표
-
1. 인공지능 데이터 활용 모델 개발 요약표 데이터명 AI 모델 모델 성능 지표 응용서비스(예시) 실생활 투명 객체 3D 데이터 3D 객체 위치 탐지 IoU score 기반
정확도 (accuracy)3D 비전, 로봇 응용 3D 객체 자세 추정 reprojection error 기반 정확도 (accuracy) VR/AR 콘텐츠 생성
2. AI 학습 모델 개발
-
2. AI 학습 모델 개발 인공지능 학습 모델 개요 (객체 3D 데이터) 개발 언어 Python 3.6 프레임워크 PyTorch 1.8.0, CUDA 11.1, OpenCV 4.5.3.56, SciPy 1.2.0, Pillow 8.2.2 학습 알고리즘 Real-Time Seamless Single Shot 6D Object Pose Prediction (CVPR18) 설치 및 테스트: https://github.com/kim-jinuk/pose 입력 정보 학습/평가 데이터: .jpg (영상), .txt (자세), .png (영역), .ply (3D 데이터) 출력 정보 객체 당 큐브의 꼭지점을 예측. 이를 통해 3D 위치/자세 값을 계산. 테스트 방법 공인 LINEMOD 데이터셋: https://paperswithcode.com/dataset/linemod-1
3. AI 학습 모델 개발의 목적
- Pose Estimation이란 카메라에서 보이는 2차원의 물체를 3차원 공간상에서 물체가 어디에 있고 어떤 방향으로 놓여 있는지 인식하는 것.
- 약 10년 전 Microsoct의 Kinect가 널리 보급되면서 연구가 활발하게 진행. Depth camera를 통해 각 이미지의 pixel들이 카메라로부터 얼마나 멀리 떨어져 있는지를 알게 되어, 타겟 물체의 3D Model 정보가 있다면 Model의 3차원 포이트들과 현재 카메라로 측정된 포인트들을 계산하여 6D(R,t)를 쉽게 추정하여 비교적 물체를 더욱 정확하게 측정해내는 것이 가능하게 됨.
- 앞선 과정을 통해 구축된 데이터셋들로 AI 학습 모델을 훈련시킨다. 학습된 모델에서 나온 결과를 카메라 내부 파라미터와 함께 비교하여 두 가지 검증 지표를 통해 데이터 유효성을 판단함.
[로봇 응용을 위한 객체 3D 위치 및 자세 추정 예시]- 구축 내용
- 데이터 구축을 통해 생성된 3D 바운딩박스 데이터셋과 투명 객체를 네트워크의 입력으로 받아 물체의 위치, 자세를 추정하는 네트워크를 구축, github (https://github.com/kim-jinuk/pose)에 공개함.
- 사용자는 코드를 내려받아 README.md의 안내에 따라 데이터셋의 경로를 맞추어 학습 모델을 훈련, 태스트 하여 검증할 수 있음.
- 신경망 모델
- 이미 공개되어있는 3D 데이터 LINEMOD를 활용하는 모델 Single-Shot-Pose(SSP)를 레퍼런스 AI 모델로 선정함. Microsoft에서 제공하는 오픈 소스 기반으로 객체 3D 위치/자세 추정하는 모델을 개발함. (https://github.com/seongheum-ssu/nia_singleshotpose)
- 배경이 모델 학습에 미치는 영향을 줄이고 객체의 위치를 추정하기 위해 학습 데이터셋은 PASCAL VOC의 배경이 합성되어 사용됨. 단, 투명 객체에 대해서는 배경의 합성이 모델 학습을 방해하므로 이를 고려하여 적절하게 수정하여 사용하였음
- 모델 학습 결과로 객체의 위치를 표현하는 3D 바운딩박스를 얻는다. 모델의 결과를 포인트 클라우드와 주어진 카메라 내부파라미터를 사용해 pnp알고리즘으로 6D(R,t)정보를 얻음.
- pnp알고리즘을 통해 얻은 예측 6D(R,t) 정보와 정답 6D(R,t)정보를 비교하여 2D projection error, IoU score를 계산함.
- Object Detection에 가장 대중적으로 알려진 YOLO의 Darknet19를 목적에 맞게 일부 수정하여 네트워크를 구성하였음.
- 하나의 이미지에 여러 객체를 탐지하는 것이 가능하도록 설계되었고 SxS 격자로 나누어 Grid 당 최대 하나의 객체를 탐지할 수 있음
- 구축 내용
-
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 객체 3D 자세 추정 (2D reprojection error 기반) 3D Pose Estimation Real-Time Seamless Single Shot 6D Object Pose Prediction Accuracy 35 % 90.23 % 2 객체 3D 위치 추정 (IoU 기반) 3D Object Detection Real-Time Seamless Single Shot 6D Object Pose Prediction Accuracy 45 % 93.78 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 명세서
-
분류 데이터 명 대용량 3D 객체 데이터 데이터 포맷 활용 분야 – 영화, 드라마 등의 미디어 컨텐츠 제작 및 VFX CG기술에 활용
– 메타버스 등 차세대 Realtime 기반 컨텐츠 제작에 활용
– 3D 객체 자세 추정
– Scene Reconstruction
– 영상기반 콘텐츠(영화, 애니메이션, 드라마, CF 등) 제작 서비스 활용
– 실감 미디어(VR·AR·XR) 서비스 활용
– 디지털 홈 트윈(Digital Home Twin) 서비스 활용
– 메타버스 서비스 활용
– 자율주행 시스템에 활용데이터 요약 500개 투명객체를 생활용도에 따른 24개 카테고리로 분류하여 데이터 편향성을 최소화하여 선정
– 원천데이터:
투명 객체 2D/3D 이미지
객체가 없는 상태에서의 배경에 대한 2D/3D 배경 이미지
비투명 객체 2D/3D이미지
– AI학습 데이터:
3D포인트 클라우드, 3D 메쉬, 공간 3D 세그멘테이션,
바운딩박스,사진 (png), 라이다 점군 (pcd),
융복합 센서 간 내/외부 파라미터데이터 출처 RGB-D 카메라 직접 촬영 20만장 데이터 이력 배포버전 개정이력 신규 작성자/배포자 진용근 데이터 통계 데이터 구축 규모 20만개 원천데이터 데이터 분포 24개 카테고리, 500개 품목:
– 데이터의 편향성을 방지하기 위해 생활분류별, 재질, 카테고리로 분류하며 병류 165 개, 그릇류 85 개, 1회용 포장류 100 개, 계량용기 30 개, 장식류 28 개, 가구류 28개, 액세서리류 44개, 기타 20 개, 비정상형태 10개로 총 500 객체의 이미지를 수집
– 투명도 측정기를 통해 다양한 투명도를 가진 객체를 대상으로 데이터 수집기타 정보 대표성 독립성 유의사항 관련 연구 해당사항 없음
2. 데이터 포맷
- 원천데이터 획득 과정에서 생성되는 데이터와 데이터 포맷
2. 데이터 포맷 분류 데이터 포맷 촬영객체 데이터 종류 투명체 2D이미지 png(NT, TR) 3D이미지 png(pcd 추출), shape(obj, ply), mask(png) 비투명체 2D이미지 png(NT, TR) 3D이미지 png(pcd 추출)(NT, TR) 3D 데이터 shape(obj, ply), mask(png) 데이터속성(메타 정보) CSV 라벨링 데이터 json -
2. 데이터 포맷 데이터 종류 원천데이터 3D 포인트 클라우드 3D 메쉬 예시 (050310.꽃병10) 원시 데이터 포맷 png PLY OBJ 데이터 구성 HD급 (1280x720) 30K 이상 8k triangle 이상 라벨링 데이터 포맷 json json json - json
표. 데이터 포맷 예시-json {"metaData":{"objectName":"꽃병10","objectCode":"050310","first_category":"장식류","second_category":"꽃병","transparency":"0.09","Fx":"905.757568359375","Fy":"906.0278930664062","PPx":"659.2559814453125","PPy":"361.3847961425781","Distorsion":"Brown Conrady","Format":"BGR8","Frame Number":"1","Timestamp (ms)":"550661.88","Resolution x":"1280","Resolution y":"720","Bytes per pixel":"3","Filename":"050310_000010_TR.png","dateTime":"2021_10_22_02:00:16","fileFormat":"PNG","imgSize":"1144.697KB","imgPhotographer":"㈜유니토 엔터테인먼트","device":"L515 (Intel Realsense LiDAR Camera)","imgLocation":"서울 금천구 유니토 스튜디오","resolution":"HD급 (1280x720)","colorDepth":"24bit/px","definition":"고","whiteBalance":"4600","F-Stop":"F2.0","flash":"미사용","focalLength":"1.88 mm","Horizontal Field of View":"69°","Vertical Field of View":"42°","Use environment":"Indoor","RGB sensor technology":"Rolling Shutter"},"inspRejectYn":"N","labelingInfo":[{"3DBox":{"location":[{"x1":"602","y1":"269","z1":"0","x2":"703","y2":"253","z2":"0","x3":"707","y3":"482","z3":"0","x4":"609","y4":"506","z4":"0","x5":"567","y5":"222","z5":"2","x6":"665","y6":"209","z6":"2","x7":"668","y7":"419","z7":"2","x8":"573","y8":"440","z8":"2","x9":"637","y9":"357","z9":"1","x-range":140,"y-range":297}],"label":"꽃병10","type":"3DBox"}}]} - 바운딩박스(Bounding Box) 어노테이션 구조
- 이미지 내 객체 영역에 대한 사각형 박스 형태의 어노테이션 구조
바운딩박스(Bounding Box) 어노테이션 구조 No. 속성명 속성 설명 Type 필수여부 예시 1 annotations[].bbox.id 바운딩박스 식별자 string 선택 BBX_0001 (분류_순번) 2 annotations[].bbox.name 바운딩박스 내 객체명 string 선택 가구1 3 annotations[].bbox.category 바운딩박스 내 객체 유형 string 선택 90001 4 annotations[].bbox.x 바운딩박스 시작점 x 좌표 number 선택 100
(좌측상단 기준)5 annotations[].bbox.y 바운딩박스 시작점 y 좌표 number 선택 120
(좌측상단 기준)6 annotations[].bbox.width 바운딩박스 가로 길이(픽셀) number 선택 273 7 annotations[].bbox.height 바운딩박스 세로 길이(픽셀) number 선택 450
- 이미지 내 객체 영역에 대한 사각형 박스 형태의 어노테이션 구조
- 3D 바운딩박스(3D Bounding Box, Cuboid) 어노테이션 구조
- 이미지 내 객체 영역에 대한 3차원 육면체 박스 형태의 어노테이션 구조
3D 바운딩박스(3D Bounding Box, Cuboid) 어노테이션 구조 No. 속성명 속성 설명 Type 필수여부 예시 1 annotations[].3dbbox.id 3D 바운딩박스 식별자 string 선택 CBD_0001 (분류_순번) 2 annotations[].3dbbox.name 3D 바운딩박스 내 객체명 string 선택 가구1 3 annotations[].3dbbox.category 3D 바운딩박스 내 객체 유형 string 선택 90001 4 annotations[].3dbbox.vertices[] 3D 바운딩박스 꼭지점 좌표 number 선택 [(10, 10, -10), ...]
[(x, y, z), ...]5 annotations[].3dbbox.edges[] 3D 바운딩박스 꼭지점 2개를 연결하는 변 좌표 number 선택 [(10, 10, 30, 10), ...]
[(x1, y1, x2, y2), ...]
- 이미지 내 객체 영역에 대한 3차원 육면체 박스 형태의 어노테이션 구조
- 세그멘테이션(Segmentation) 어노테이션 구조
- 이미지 내 객체 영역에 대한 다각형 형태의 어노테이션 구조
세그멘테이션(Segmentation) 어노테이션 구조 No. 속성명 속성 설명 Type 필수여부 예시 1 annotations[].segm.id 세그멘테이션 식별자 string 선택 SEG_0001 (분류_순번) 2 annotations[].segm.name 세그멘테이션 내 객체명 string 선택 가구1 3 annotations[].segm.category 세그멘테이션 내 객체 유형 string 선택 90001 4 annotations[].segm.point[] 세그멘테이션 내 점(x, y)의 집합 number 선택 [(100, 105), ...(160, 104)]
- 이미지 내 객체 영역에 대한 다각형 형태의 어노테이션 구조
- 학습 데이터 저장 구조: JSON
학습 데이터 저장 구조: JSON 항목 설명 info -기본정보 identifier 데이터셋 식별자 name 데이터셋 이름 src_path 데이터셋 폴더 위치 label_path 데이터셋 레이블 폴더 위치 category 데이터셋 카테고리 type 데이터셋 타입 images – 이미지 데이터 정보 Images 항목 설명 identifier 식별자 dateTime 촬영일시 fileFormat 파일 포맷 imgSize 이미지 파일 크기 imgPhotographer 촬영자 device 장비정보 imgLocation 촬영위치 copyRight 저작권정보 resolution 이미지 해상도 colorDepth 컬러깊이 ISO ISO감도 definition 선명도 whiteBalance 화이트 밸런스 exposureTime 노출시간 exposureMode 노출모드 F-Stop 조리개 값 flash 플래시 사용여부 filter 필터 focalLength 초점거리 fieldOfView 시야각(화각) angle 촬영각도 GPS GPS정보 weather 날씨 annotations – 어노테이션 데이터 정보 annotations bbox – 바운딩 박스 어노테이션 데이터 정보 bbox 항목 설명 id 바운딩박스 식별자 name 바운딩박스 내 객체명 category 바운딩박스 내 객체 유형 x 바운딩박스 시작점 x 좌표 y 바운딩박스 시작점 y 좌표 width 바운딩박스 가로 길이(픽셀) height 바운딩박스 세로 길이(픽셀) 3dbbox – 3D 바운딩 박스(Cuboid) 어노테이션 데이터 정보 3ddbox 항목 설명 id 3D 바운딩박스 식별자 name 3D 바운딩박스 내 객체명 category 바운딩박스 내 객체 유형 vertices[] 3D 바운딩박스 꼭지점 좌표 edges[] 3D 바운딩박스 꼭지점 2개를 연결하는 변 좌표 Polygon – 폴리곤 어노테이션 데이터 정보 Polygon 항목 설명 id 폴리곤 식별자 name 폴리곤 내 객체명 category 폴리곤 내 객체 유형 points[] 폴리곤 내 점(x, y)의 집합 Polyline – 폴리라인 어노테이션 데이터 정보 Polyline 항목 설명 id 폴리라인 식별자 name 폴리라인 내 객체명 category 폴리라인 내 객체 유형 points[] 폴리라인 내 점(x, y)의 집합 segm – 세그멘테이션 어노테이션 데이터 정보 segm 항목 설명 id 세그멘테이션 식별자 name 세그멘테이션 내 객체명 category 세그멘테이션 내 객체 유형 points[] 세그멘테이션 내 점(x, y)의 집합 - 3D 데이터 메타 속성 관련하여 관련하여 3D 포인트 클라우드 : PLY, 3D 메쉬 : OBJ 등 가장 일반적으로 사용되는 파일 포맷을 사용하도록 하고, 가공 데이터(라벨링, 어노테이션 등) 포맷도 보편적으로 활용 가능한 json을 사용함
- 3D 이미지에 대한 메타속성 관련하여, AI Hub의 한국형 사물이미지 AI 데이터 구축 가이드라인 등을 참고하여 3D 이미지에 대한 메타 속성 정보를 추가 정리함
- 3D 투명객체 2D(polygon) json파일 메타정보 >
3D 투명객체 2D(polygon) json파일 메타정보 구분 항목명 타입 필수여부 설명 범위 비고 1 metaData String Y 메타데이터 지칭 범위 미지정 - 1-1 objectName String N 객체명 1-2 objectCode String N 객체코드 엑셀파일 1-3 first_category String N 객체 분류-대분류 [범위값.xlsx] 참조 1-4 second_category String N 객체 분류-중분류 1-5 transparency String Y 투명도 “0.00” ~ “1.00” 1-6 Fx String Y 초점거리 범위 미지정 1-7 Fy String Y 초점거리 1-8 PPx String Y 주점 1-9 PPy String Y 주점 1-10 Distorsion String N 왜곡 1-11 Format String N 16비트 depth 값 1-12 Frame Number String N 프레임 번호 1-13 Timestamp (ms) String N 촬영시간기록 1-14 Resolution x String Y 해상도 X “1280” 1-15 Resolution y String Y 해상도 Y “720” 1-16 Bytes per pixel String N 픽셀당바이트 범위 미지정 1-17 Filename String Y 영상 파일명 1-18 dateTime String N 촬영일시 1-19 fileFormat String N 파일형식 1-20 imgSize String N 용량 1-21 imgPhotographer String N 촬영기관 1-22 device String N 촬영장비 1-23 imgLocation String N 촬영장소 1-24 resolution String N 해상도 1-25 colorDepth String N 색심도 1-26 definition String N 선명도 1-27 whiteBalance String N 색온도 1-28 F-Stop String N 조리개 구경비 1-29 flash String N 플래시사용여부 1-30 focalLength String N 초점거리 1-31 Horizontal Field of View String N 수평관측가능영역 1-32 Vertical Field of View String N 수직관측가능영역 1-33 Use environment String N 촬영환경(실내외) 1-34 RGB sensor technology String N RGB 센서 기술 2 inspRejectYn String Y 데이터 반려 여부 “Y”, “N” 3 labelingInfo array Y 라벨링 객체 순번 범위 미지정 3-1 polygon Object Y 라벨링 종류 3-1-1 location array Y 좌표 위치 3-1-1-1 x1 String Y x1좌표 “0” ~ “1280” 가변 포인트 좌표 3-1-1-2 y1 String Y y1좌표 “0” ~ “720” 3-1-1-3 x2 String Y x2좌표 “0” ~ “1280” 3-1-1-4 y2 String Y y2좌표 “0” ~ “720” 3-1-1-5 x3 String Y x3좌표 “0” ~ “1280” 3-1-1-6 y3 String Y y3좌표 “0” ~ “720” 3-1-1-7 x4 String Y x4좌표 “0” ~ “1280” 3-1-1-8 y4 String Y y4좌표 “0” ~ “720” 3-1-1-9 x5 String Y x5좌표 “0” ~ “1280” 3-1-1-10 y5 String Y y5좌표 “0” ~ “720” … … … … … 3-1-2 label String Y 라벨 카테고리 엑셀파일 - [범위값.xlsx] 참조 3-1-3 type String Y 라벨링 타입 “polygon” 3-2 box Object Y 라벨링 종류 범위 미지정 3-2-1 location array 3-2-1-1 x int Y x좌표 0 ~ 1280 가변 포인트 좌표 3-2-1-2 width int Y 가로 0 ~ 1280 3-2-1-3 y int Y y좌표 0 ~ 720 3-2-1-4 height int Y 세로 0 ~ 720 3-2-2 label String Y 라벨 카테고리 엑셀파일 - [범위값.xlsx] 참조 3-2-3 type String Y 라벨링 타입 “box”
- 3D 투명객체 3D Box json파일 메타정보
3D 투명객체 3D Box json파일 메타정보 구분 항목명 타입 필수여부 설명 범위 비고 1 metaData String Y 메타데이터 지칭 범위 미지정 - 1-1 objectName String N 객체명 1-2 objectCode String N 객체코드 엑셀파일 1-3 first_category String N 객체 분류-대분류 [범위값.xlsx] 참조 1-4 second_category String N 객체 분류-중분류 1-5 transparency String Y 투명도 “0.00” ~ “1.00” 1-6 Fx String Y 초점거리 범위 미지정 1-7 Fy String Y 초점거리 1-8 PPx String Y 주점 1-9 PPy String Y 주점 1-10 Distorsion String N 왜곡 1-11 Format String N 16비트 depth 값 1-12 Frame Number String N 프레임 번호 1-13 Timestamp (ms) String N 촬영시간기록 1-14 Resolution x String Y 해상도 X “1280” 1-15 Resolution y String Y 해상도 Y “720” 1-16 Bytes per pixel String N 픽셀당바이트 범위 미지정 1-17 Filename String Y 영상 파일명 1-18 dateTime String N 촬영일시 1-19 fileFormat String N 파일형식 1-20 imgSize String N 용량 1-21 imgPhotographer String N 촬영기관 1-22 device String N 촬영장비 1-23 imgLocation String N 촬영장소 1-24 resolution String N 해상도 1-25 colorDepth String N 색심도 1-26 definition String N 선명도 1-27 whiteBalance String N 색온도 1-28 F-Stop String N 조리개 구경비 1-29 flash String N 플래시사용여부 1-30 focalLength String N 초점거리 1-31 Horizontal Field of View String N 수평관측가능영역 1-32 Vertical Field of View String N 수직관측가능영역 1-33 Use environment String N 촬영환경(실내외) 1-34 RGB sensor technology String N RGB 센서 기술 2 inspRejectYn String Y 데이터 반려 여부 “Y”, “N” 3 labelingInfo array Y 라벨링 객체 순번 범위 미지정 3-1 3DBox Object Y 라벨링 종류 3-1-1 location array Y 좌표 위치 3-1-1-1 x1 String Y x1좌표 “0” ~ “1280” 3-1-1-2 y1 String Y y1좌표 “0” ~ “720” 3-1-1-3 z1 String Y 앞, 뒷, 중앙면 구분 “0” 3-1-1-4 x2 String Y x2좌표 “0” ~ “1280” 3-1-1-5 y2 String Y y2좌표 “0” ~ “720” 3-1-1-6 z2 String Y 앞, 뒷, 중앙면 구분 “0” 3-1-1-7 x3 String Y x3좌표 “0” ~ “1280” 3-1-1-8 y3 int Y y3좌표 “0” ~ “720” 3-1-1-9 z3 String Y 앞, 뒷, 중앙면 구분 “0” 3-1-1-10 x4 String Y x4좌표 “0” ~ “1280” 3-1-1-11 y4 String Y y4좌표 “0” ~ “720” 3-1-1-12 z4 String Y 앞, 뒷, 중앙면 구분 “0” 3-1-1-13 x5 String Y x5좌표 “0” ~ “1280” 3-1-1-14 y5 String Y y5좌표 “0” ~ “720” 3-1-1-15 z5 String Y 앞, 뒷, 중앙면 구분 “2” 3-1-1-16 x6 String Y x6좌표 “0” ~ “1280” 3-1-1-17 y6 String Y y6좌표 “0” ~ “720” 3-1-1-18 z6 String Y 앞, 뒷, 중앙면 구분 “2” 3-1-1-19 x7 String Y x7좌표 “0” ~ “1280” 3-1-1-20 y7 String Y y7좌표 “0” ~ “720” 3-1-1-21 z7 String Y 앞, 뒷, 중앙면 구분 “2” 3-1-1-22 x8 String Y x8좌표 “0” ~ “1280” 3-1-1-23 y8 String Y y8좌표 “0” ~ “720” 3-1-1-24 z8 String Y 앞, 뒷, 중앙면 구분 “2” 3-1-1-25 x9 String Y x9좌표 “0” ~ “1280” 3-1-1-26 y9 String Y y9좌표 “0” ~ “720” 3-1-1-27 z9 String Y 앞, 뒷, 중앙면 구분 “1” 3-1-1-28 x-range int Y max(x) - min(x) 0 ~ 1280 3-1-1-29 y-range int Y max(y) - min(y) 0 ~ 720 3-1-2 label String Y 라벨 카테고리 엑셀파일 - [범위값.xlsx] 참조 3-1-3 type String Y 라벨링 타입 “3DBox”
※ 동일한 데이터 셋에 다수 개 스키마를 적용한 경우, 스키마 별로 라벨 구성요소를 작성한다.
-
-
데이터셋 구축 담당자
수행기관(주관) : ㈜미소정보기술
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 진용근 02-2205-0551 [email protected] · 사업관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜유니토엔터테인먼트 · 데이터 수집 ㈜미래융합정보기술 · 데이터 정제 (주)메트릭스리서치 · 데이터 가공 ㈜에스에스엘 · 데이터 검수 ㈜위지웍스튜디오 · AI응용서비스 개발 충남대학교 산학협력단 · AI모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 진용근 02-2205-0551 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.