-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2024-06-04 품질보완 완료 데이터 개방 1.1 2023-02-10 원천데이터 및 라벨링데이터 수정 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-05 저작도구, 저작도구 설명서 등록 2024-06-04 데이터설명서, 구축활용가이드, 상세페이지 변경 2023-03-23 담당자 변경 2022-10-21 신규 샘플데이터 개방 2022-07-29 콘텐츠 최초 등록 소개
스마트 축사를 위한 월령별 한우의 상태를 진단하고 모체 정보를 연동시킴으로써 한우의 종자관리가 가능한 데이터셋
구축목적
축산(한우) 분야의 각 단계에 인공지능을 적용하여 축사 내·외부 생육, 상태 진단 및 최적의 상태로 유지하기 위한 사육환경, 농장관리 등을 인공지능(AI)을 통해 분석할 수 있는 데이터 구축을 목표로 함
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 오디오 , 이미지 데이터 형식 이미지(jpg) 데이터 출처 직접 수집 라벨링 유형 바운딩박스(이미지), 폴리곤(이미지), 키포인트(이미지) 라벨링 형식 XML 데이터 활용 서비스 축사에서 사육되는 한우의 상태(발정, 건강 상태 등)를 진단하고 최적의 상태로 유지하기 위한 사육환경, 농장관리 등을 인공지능을 통해 분석하며, 최적의 축사 관리가 가능하도록 환경 정보, 사양 관리 정보, 생체 정보, 영상 정보의 복합적인 서비스로 활용함 데이터 구축년도/
데이터 구축량2021년/원천데이터: 331,213건, 라벨링데이터: 649건 -
1. 데이터 구축 규모
• 원천 데이터: 약 33만 건 규모의 jpg형태
• 라벨링 데이터: 약 650건 규모의 xml형태
2. 데이터 분포
• 원천 데이터2. 데이터 분포 원천 데이터 구분 구축 수량 비율 바운딩박스 덕풍농장 F.암소(번식우) 임신분만우 600 0.18% 포유번식우 25,500 7.70% 새봄농장 F.암소(번식우) 육성우 22,049 6.66% 미경산우 8,390 2.53% 평창농장 M.수소(거세,비육우) 육성우 4,805 1.45% 비육우 전기 1,800 0.54% 비육우 후기 11,316 3.42% 우영축산 M.수소(거세,비육우) 이유전 송아지 15,026 4.54% 중송아지 11,700 3.53% 폴리곤 덕풍농장 F.암소(번식우) 임신분만우 10,178 3.07% 포유번식우 3,930 1.19% M.수소(거세,비육우) 비육우 전기 900 0.27% 새봄농장 F.암소(번식우) 육성우 5,519 1.67% 미경산우 5,142 1.55% M.수소(거세,비육우) 이유전 송아지 19,200 5.80% 평창농장 M.수소(거세,비육우) 중송아지 631 0.19% 비육우 전기 5,767 1.74% 우영축산 M.수소(거세,비육우) 이유전 송아지 10,771 3.25% 중송아지 11,400 3.44% 키포인트 덕풍농장 F.암소(번식우) 임신분만우 24,900 7.52% 포유번식우 48,857 14.75% M.수소(거세,비육우) 비육우 전기 600 0.18% 새봄농장 F.암소(번식우) 육성우 12,516 3.78% 미경산우 18,524 5.59% 평창농장 M.수소(거세,비육우) 육성우 12,300 3.71% 비육우 전기 8,439 2.55% 비육우 후기 10,800 3.26% 우영축산 F.암소(번식우) 포유번식우 10,591 3.20% M.수소(거세,비육우) 이유전 송아지 7,862 2.37% 중송아지 1,200 0.36% 합 계 331,213 100.00% • 라벨링 데이터
2. 데이터 분포 라벨링 데이터 구분 구축 수량 비율 바운딩박스 덕풍농장 F.암소(번식우) 임신분만우 1 0.15% 포유번식우 50 7.70% 새봄농장 F.암소(번식우) 육성우 35 5.39% 미경산우 18 2.77% 평창농장 M.수소(거세,비육우) 육성우 17 2.62% 비육우 전기 3 0.46% 비육우 후기 19 2.93% 우영축산 M.수소(거세,비육우) 이유전 송아지 28 4.31% 중송아지 29 4.47% 폴리곤 덕풍농장 F.암소(번식우) 임신분만우 32 4.93% 포유번식우 9 1.39% M.수소(거세,비육우) 비육우 전기 2 0.31% 새봄농장 F.암소(번식우) 육성우 13 2.00% 미경산우 16 2.47% M.수소(거세,비육우) 이유전 송아지 32 4.93% 평창농장 M.수소(거세,비육우) 중송아지 1 0.15% 비육우 전기 18 2.77% 우영축산 M.수소(거세,비육우) 이유전 송아지 22 3.39% 중송아지 38 5.86% 키포인트 덕풍농장 F.암소(번식우) 임신분만우 42 6.47% 포유번식우 82 12.63% M.수소(거세,비육우) 비육우 전기 1 0.15% 새봄농장 F.암소(번식우) 육성우 21 3.24% 미경산우 31 4.78% 평창농장 M.수소(거세,비육우) 육성우 23 3.54% 비육우 전기 13 2.00% 비육우 후기 18 2.77% 우영축산 F.암소(번식우) 포유번식우 18 2.77% M.수소(거세,비육우) 이유전 송아지 13 2.00% 중송아지 4 0.62% 합 계 649 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 인공지능 기반 한우 승가행위 인식/예측 모델
• 개발 목표: 한우 승가행위 인식/예측
• Object Detection / Semantic Segmentation 기술
- 최근 딥러닝 기술은 사람이나 동물 시각 체계의 기능을 컴퓨터로 구현하는 컴퓨터 비전 (Computer Vision) 분야에서 널리 활용되고 있으며, 특히 합성곱 신경망 (Convolutional Nerual Network; CNN) 모델은 개체 분류 및 탐지 기능에서 높은 정확도와 속도를 나타내는 것으로 널리 알려져 있음.그림 1. CNN 모델 알고리즘 모식도
- CNN은 그림 1 과 같은 알고리즘을 통해 작동하게 되는데, 우선적으로 입력 데이터에 대한 적절한 필터를 통해 이미지를 추출하는 Convolution을 수행한 후, 추출한 특징을 강화하고 실제 사용되는 이미지의 크기를 압축하는 Pooling 과정을 거치게 됨. 이 두 과정을 여러 번 반복하는 feature extraction 과정 이후에, 최종적으로 얻어낸 feature들로 classification을 수행하게 됨. 위와 같은 알고리즘을 가지는 CNN은 컴퓨터 비전 분야에서 강력한 영향력을 지니며, 이를 기반으로 확장된 CNN관련 딥러닝 알고리즘들이 해당 분야에 널리 사용되고 있음.
- 이러한 CNN기술은 이미지 전체를 활용하는 것이기 때문에 단순 image classification 이었다면, 이러한 기술을 활용하여 개체를 탐지해내는 object detection 또한 가능하게 됨. Object detection은 이미지를 class 별로 분류하는 것 뿐만 아니라, 한 이미지 내의 다중 개체에 대해서 그 위치를 파악하는 기술을 일컬음. 이러한 object detection에서 가장 널리 쓰이는 알고리즘은 Faster R-CNN으로, CNN에 기반을 두고 있음. Faster R-CNN은 Region Proposal Network (RPN)이라는 개념을 도입하였음. RPN은 이미지를 CNN에 통과시킨 feature map을 input으로 삼아 Region of Interest (RoI) 라는 classification/bounding box output을 도출하는 것으로써, 이 RPN을 통해 얻어낸 RoI 부분만을 이용한 CNN을 수행함 (R-CNN).그림 2. Faster R-CNN 모델 알고리즘 모식도
- Semantic segmentation은 위에서 기술한 object detection에서 한 단계 더 나아간 컴퓨터 비전 기술로서, 단순 물체의 detection이 아니라, 정확한 픽셀 단위 분류를 수행하는 분야임. 본 과제에서 수행한 polygon labelling 데이터는 단순히 object detection 뿐만이 아니라, semantic segmentation을 수행하기 적합한 데이터임. 이러한 Semantic segmentation 분야에서 가장 많이 쓰이는 알고리즘인 Mask R-CNN은 Faster R-CNN를 기본 구조로 하여, 개체의 마스크를 예측하는 개체 분할 레이어를 병렬로 추가하여 부착한 구조를 가지고 있음.
- Mask R-CNN은 입력받은 이미지에서 특징 (Feature)를 추출하고, 개체가 존재할 가능성이 있는 영역 (RoI)을 먼저 예측한 다음 해당 지역에서 고정된 크기의 feature map으로 전환하는 RoI Align을 수행하고, 이를 입력으로 주어 개체의 최종 class, bounding box, mask 3개의 output을 예측하게 됨.그림 3. Mask R-CNN 모델 알고리즘 모식도
- 본 과제를 통해 구축된 폴리곤 데이터셋을 학습하여 한우 개체 인식 능력을 가지는 승가 행위/일반 행위 구분 모델을 구축하였고, 해당 구축 내용은 docker 형태로 제출하였음.
• 구축 상세 기술
- Detectron2는 Facebook AI Research (FAIR)에서 Mask R-CNN을 벤치마킹하여 속도 및 확장성을 개선한 딥러닝 API임.
- Mask R-CNN은 위에서 서술한 바와 같이 개체의 class를 예측하는 classification branch, bounding box를 추정하는 bbox regression branch, 그리고 segmentation mask를 예측하는 mask branch 총 3개의 구조로 이루어져 있음 (그림 3).
- Detectron2을 이용해 모델링을 수행할 때, 사전학습 된 모델을 backbone으로서 사용할 수 있음. 본 연구에서는 ResNet+FPN 기반의 Mask R-CNN R50-FPN 3x 사전학습 개체 인식 모델을 기반으로, 본 연구의 데이터셋을 학습하였음.• 상세 알고리즘 학습 가이드라인
- 본 과제에서 제안한 모델 학습/생성을 위해서, 본 과제의 데이터셋 및 docker 환경 (Cow_polygon.tar 파일 제출) 세팅이 필요함.
- 제공한 docker 는 아래와 같은 방법을 통해 세팅 가능함
1. 제공한 Cow_Polygon.tar 파일 다운로드 및 위치 설정
2. docker load -i Cow_Polygon.tar 실행 (docker image load)
3. load 시 아래와 같은 command 를 볼 수 있을 것임##################
$docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
Cow_Polygon 1.0 2dfae3eab927 1 hours ago 235MB
##################4. docker run -it --gpus all --name Cow_Polygon -p 8051:8051 Cow_Polygon:1.0 실행
( docker image 실행)
# -gpus 를 전체 다 사용할 경우는 all / 하나만 사용할 경우에는 gpu 번호를 사용해야함
# --name 은 변경 가능
# -p : jupyter 연결을 위한 PortNumber 이기때문에 변경 가능
# docker container 재접속 시, docker start / attach 등의 과정을 통해 재접속 가능- 위와 같은 방법으로 docker 세팅 및 실행 이후, 아래와 같은 방식을 통해 docker 내에 적재된 python 파일의 실행을 통해 모델 학습 및 결과 도출을 수행할 수 있음
0. conda activate detectron
1. 1.rawdata에 폴더(images폴더 내 image 파일들 / annotations.xml 파일) 적재 (여러개의 폴더도 가능)
2. python data_parsing.py 실행하여 json 형태로 변경
3. python split.py 실행하여 train, validation, test set으로 변경
4. jupyter notebook polygon_training.ipynb 실행 혹은 jupyter로 해당 폴더에 들어온 후 polygon_training.ipynb 실행
- 이후 line by line 실행
## model training 없이 prediction 만 수행할 경우, 5line / 7line 실행하지 않음
5. python calculate_results.py 실행
6. Final_output.txt 생성 확인• 학습 결과 및 관련 통계
- 본 과제에서 제안한 폴리곤 데이터셋을 이용하여 학습한 결과는 아래와 같음 (COCOevaluator 이용). 해당 성능에 대한 측정은 개체인식 분야에서 주로 사용되는 Pascal-VOC 기반의 AP50 을 기준으로 하였음.그림 4. 한우 발정 모델 학습 결과 및 결과 통계
- 위 그림에서 제시된 바와 같이, AP50 은 99에 달하여 매우 높은 정확도를 가지며, category 별 AP를 측정한 결과 또한 약 90 정도로 매우 높은 것을 알 수 있음.
- Test 데이터셋에 대한 prediction 결과 예시는 아래와 같으며, 승가행위 소 개체에 대한 인식을 성공적으로 수행하는 것을 알 수 있음.본 과제에서 생성한 폴리곤 데이터셋을 학습한 Mask R-CNN 결과 이미지
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 데이터 개요
• (범위) 스마트 축사에서 사육되는 한우의 상태(발정, 분만 및 건강상태 등)를 진단하고, 최적의 상태로 유지하기 위한 사육환경, 농장관리 등을 인공지능을 통해 분석할 수 있는 고품질의 데이터를 구축하고, 개방하며, 인공지능 학습을 통한 활용서비스를 개발 가능한 범위로 구성
• (구성내용) 개체사양 및 축사정보등과 같은 스마트축사를위한 월령별 한우의 행동 이미지를 이용하여 한우의 상태를 진단하고 모체정보를 연동시킴으로써 한우의 종자관리가 가능하도록 구성
• (수집범위) 실시간 IoT 센서 데이터 분석을 통하여 최적의 사육환경 조성을 하기 위한 통합 시나리오 수립 및 데이터 수집2. 어노테이션 포맷
2. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 floats object Y 어노테이션 정보 meta, image 1-1 meta object Y 메타 데이터 task, dumped, source 1-1-1 task object Y 메타 데이터 상세 id, name, size, mode, overlap, bugtracker, created, updated, start_frame, stop_frame, frame_filter, labels, segments, owner, assignee, original_size 1-1-1-1 id number Y 프레임 수 0~99999 1-1-1-2 name string Y 파일명 enum 1-1-1-3 size int Y 이미지픽셀 1920* 1080 1-1-1-4 mode string Y 모드 - 1-1-1-5 overlap int Y Overlap - 1-1-1-6 bugtracker - - - - 1-1-1-7 created date Y 파일생성 일시 YYYY-MM-DD HH:MM:SS. 1-1-1-8 updated date Y 파일 업데이트 일시 YYYY-MM-DD HH:MM:SS. 1-1-1-9 start_frame int Y 시작 이미지 0 1-1-1-10 stop_frame int Y 종료 이미지 1~9999 1-1-1-11 frame_filter string Y 추출 이미지 간격 step=0~9999? 1-1-1-12 labels object Y 객체정의 label 1-1-1-12-1 label object Y 객체정의 상세 name, (클라스별로 반복) color, attributes 1-1-1-12-1-1 name enum Y 객체 이름 - 1-1-1-12-1-2 color string Y 색깔 정보 #FFA000 (Hex color) 1-1-1-12-1-3 attributes - - - - 1-1-1-13 segments object Y - segment 1-1-1-13 segment object Y - id, start, stop, url 1-1-1-13-1 id int Y - - 1-1-1-13-2 start int Y - - 1-1-1-13-3 stop int Y - - 1-1-1-13-4 url enum Y - - 1-1-1-14 owner object Y 작성자 username, email 1-1-1-14-1 username enum Y 계정 ID - 1-1-1-14-2 email enum - 이메일 주소 - 1-1-1-15 assignee enum - 검수자 - 1-1-1-16 original_size object Y - wigth, height 1-1-1-16-1 wigth int Y 가로 사이즈 0~9999 1-1-1-16-2 height int Y 세로 사이즈 0~9999 1-1-2 dumped date Y - YYYY-MM-DD HH:MM:SS. 1-1-3 source string Y 동영상 파일명 enum 1-2 image Object Y 프레임 정보 id, name, Wigth, height 1-3 id int Y 프레임 번호 0~999 1-4 name String Y 파일명 frame_000000~999999 1-5 wigth int Y 이미지 폭 2944 1-6 height int Y 이미지 높이 1656 1-6-1 box Object Y 어노테이션 형식 label occluded source xtl ytl xbr ybr z_order 1-6-2 label String Y 객체부위 정의 Right_behind_leg, Left_behind_leg, Right_front_leg, Left_front_leg, Head, Hip 1-6-3 occluded int Y 가려진 객체 0,1 1-6-4 truncated int Y 잘려진 객체 0,2 1-6-5 xtl float Y 좌측상단 X 위치 0~2944 1-6-6 ytl float Y 좌측상단 Y 위치 0~1656 1-6-7 xbr float Y 우측하단 X 위치 0~2944 1-6-8 ybr float Y 우측하단 Y 위치 0~1656 1-6-9 z_order int - 중앙 가상점 0~3377 1-6-1 polygon Object Y 어노테이션 형식 label occluded source points z_order 1-6-2 label String Y 객체상태 정의 Standing, Walking, Running, Eating, Drinking, Searching, Scrubbing, Urinating,Defecting, Resting, Sitting,Coughing, Parturition, Lying, Suckling 1-6-3 occluded int Y 가려진 객체 0,1 1-6-4 truncated int Y 잘려진 객체 0,2 1-6-5 points float Y 포인트 위치 x=0~2944 x,y;x,y;x,y;.... y=0~1656 1-6-6 z_order int - 중앙 가상점 0~3377 1-6-1 keypoint Object Y 어노테이션 형식 label occluded source points z_order 1-6-2 label String Y 객체상태 정의 Standing, Walking, Running, Eating, Drinking, Searching, Scrubbing, Urinating,Defecting, Resting, Sitting,Coughing, Parturition, Lying, Suckling 1-6-3 occluded int Y 가려진객체 0,1 1-6-4 truncated int Y 잘려진객체 0,2 1-6-5 points float Y 포인트 위치 x=0~2944 x,y;x,y;x,y;.... y=0~1656 1-6-6 z_order int - 중앙 가상점 0~3377 3. 원천데이터 및 라벨링 데이터 예시
• XML 데이터 - 바운딩박스
3. 원천데이터 및 라벨링 데이터 예시 XML 데이터 - 바운딩박스 Bounding Box 원천 데이터 라벨링 데이터 < ?xml version="1.0" encoding="UTF-8"? >
-< annotations >
< version >1.1< /version >
-< meta >
-< task >
< id >219< /id >
< name >한우_덕풍_일반_이승엽_0818_수정 김예지< /name >
< size >300< /size >
< mode >interpolation< /mode >
< overlap >5< /overlap >
< bugtracker/ >
< created >2021-08-18 09:57:20.892013+00:00< /created >
< updated >2021-09-06 02:20:19.186262+00:00< /updated >
< start_frame >0< /start_frame >
< stop_frame >5980< /stop_frame >
< frame_filter >step=20< /frame_filter >
-< labels >
-< label >
< name >Right_behind_leg< /name >
< color >#df32db< /color >
< attributes > < /attributes >
< /label >
.
.
.
< dumped >2021-09-16 00:39:42.930962+00:00< /dumped >
< source >01_D05_F4_99_Z_210802_0659_0701.mp4< /source >
< /meta >
-< image height="1656" width="2944" name="frame_000000" id="0" >
< box z_order="0" ybr="786.15" xbr="1009.94" ytl="611.90" xtl="943.33" source="manual" occluded="1" label="Right_behind_leg" > < /box >
< box z_order="0" ybr="475.81" xbr="1033.21" ytl="272.89" xtl="875.00" source="manual" occluded="0" label="Hip" > < /box >
< box z_order="0" ybr="718.51" xbr="631.61" ytl="569.50" xtl="572.00" source="manual" occluded="1" label="Right_front_leg" > < /box >
< box z_order="0" ybr="421.29" xbr="461.10" ytl="249.20" xtl="304.07" source="manual" occluded="1" label="Hip" > < /box >
< box z_order="0" ybr="827.42" xbr="1103.95" ytl="533.93" xtl="887.27" source="manual" occluded="1" label="Left_behind_leg" > < /box >
< box z_order="0" ybr="770.10" xbr="608.68" ytl="538.52" xtl="489.45" source="manual" occluded="0" label="Left_front_leg" >
.
.
.
• XML 데이터 – 폴리곤3. 원천데이터 및 라벨링 데이터 예시 XML 데이터 – 폴리곤 Polygon 원천 데이터 라벨링 데이터 < ?xml version="1.0" encoding="utf-8"? >
< annotations >
< version >1.1< /version >
< meta >
< task >
< id >691< /id >
< name >한우_우영_일반_문지원_0827< /name >
< size >600< /size >
< mode >interpolation< /mode >
< overlap >5< /overlap >
< bugtracker >< /bugtracker >
< created >2021-08-27 11:41:14.199398+00:00< /created >
< updated >2021-09-07 19:02:47.387379+00:00< /updated >
< start_frame >0< /start_frame >
< stop_frame >5990< /stop_frame >
< frame_filter >step=10< /frame_filter >
< labels >
< label >
< name >Mating Acceptance< /name >
< color >#f0f00b< /color >
< attributes >
< /attributes >
.
.
.
< /task >
< dumped >2021-09-16 06:02:11.068722+00:00< /dumped >
< source >04_D04_M1_F5_99_A_F_J_210821_1840_1845.mp4< /source >
< /meta >
< image id="0" name="frame_000000" width="2944" height="1656" >
< polygon label="Stand" occluded="1" source="manual" points="1051.70,913.00;1047.10,902.90;1045.50,890.80;1047.10,879.70;1048.30,870.60;1046.97,860.15;1048.93,850.35;1058.73,851.01;1068.20,857.50;1075.40,864.60;1080.10,872.50;1083.70,881.30;1086.60,890.20;1089.43,899.34;1097.93,905.22;1105.76,911.76;
1113.60,918.29;1122.09,924.17;1130.59,929.39;1137.77,936.58;1144.30,944.42;1150.18,952.91;1152.50,962.10;
.
.
.
.80,913.60" z_order="0" >
< /polygon >
• XML 데이터 - 키포인트
3. 원천데이터 및 라벨링 데이터 예시 XML 데이터 - 키포인트 Keypoint 원천 데이터 라벨링 데이터 < ?xml version="1.0" encoding="utf-8"? >
< annotations >
< version >1.1< /version >
< meta >
< task >
< id >7< /id >
< name >test_0810_1< /name >
< size >11< /size >
< mode >interpolation< /mode >
< overlap >5< /overlap >
< bugtracker >< /bugtracker >
< created >2021-08-10 07:25:11.253381+00:00< /created >
< updated >2021-08-12 02:51:58.303549+00:00< /updated >
< start_frame >0< /start_frame >
< stop_frame >200< /stop_frame >
< frame_filter >step=20< /frame_filter >
.
.
.
< /meta >
< image id="160" name="frame_000160" width="2944" height="1656" >
< points label="sitting" occluded="0" source="manual" points="169.33,1374.08;200.66,1225.25;106.66,1193.92;130.16,1084.25;247.66,1136.47;289.44,1034.64;485.27,932.81;824.71,932.81;1057.10,971.97;1273.82,1094.70;1145.87,1261.80;1096.26,1389.75;952.65,1468.08;897.82,1549.02;
803.82,1499.41;842.99,1439.36;989.21,1368.86;576.66,1415.86;422.60,1426.30;534.88,1319.25;370.38,1285.30" z_order="0" >
< /points >
< /image >
< image id="180" name="frame_000180" width="2944" height="1656" >
< /image >
< image id="200" name="frame_000200" width="2944" height="1656" >
< /image >
< /annotations > -
데이터셋 구축 담당자
수행기관(주관) : SK주식회사
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 곽종훈 02-6400-4938 [email protected] 데이터 총괄, 설계, 수집 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜디타스 설계, 가공, 검수, AI모델 ㈜여덟끼니 수집, 정제, 가공 ㈜리얼팜 수집 ㈜이지놈 AI모델 서울대학교 산학협력단 설계, 수집, 정제, 가공, 검수 한경대학교 산학협력단 설계, 정제, 가공 검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 곽종훈 02-6400-4938 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.