-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.3 2024-07-30 데이터 수정 및 추가 개방 1.2 2024-05-20 품질보완 완료 데이터 개방 1.1 2023-02-09 원천데이터 및 라벨링데이터 수정 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-05-20 데이터설명서, 구축가이드라인, 데이터통계, 어노테이션 포맷 및 데이터 구조, 활용 AI모델 및 코드, 구축업체정보 변경 2022-10-20 신규 샘플데이터 개방 2022-10-06 교육동영상 수정 개방 2022-07-29 콘텐츠 최초 등록 소개
스마트 축사 데이터(젖소)과제의 학습 데이터를 구축하여 최적의 축사 관리가 가능하도록 환경정보, 사양관리정보, 생체정보, 영상, 음성 정보의 복합적인 데이터를 구축하여 축산물 수급 등 축산업 정책 수립, 축산통계의 개선, 축산물의 생산량 조절, 축산물의 적정공급 및 가격안정 정책 수립 및 관련 학술연구에 있어 핵심 자료로 제공하며, 육계, 산란계, 젖소의 사양, 질병, 번식 연구를 통해 수집한 데이터를 활용한 인공지능 알고리즘 개발 관련 연구를 통하여 빅데이터 플랫폼 및 질병 탐지 모델 구축
구축목적
스마트 축사에서 사육되는 젖소의 사육단계(포유기, 이유기, 육성기, 초임우, 경산우) 및 사양관리 상태(발정, 비유시기, BCS, 유량, 질병 및 사료관리 등)를 예방 및 관리하고, 최적의 상태로 축사를 유지하기 위한 사육환경, 사양관리 및 경영관리 등을 인공지능 분석을 통해 통합(영상+음성+사양관리) 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 오디오 , 이미지 데이터 형식 png, wav 데이터 출처 CCTV 및 DSLR 카메라 촬영을 통한 영상 데이터 수집 라벨링 유형 바운딩박스, 키포인트 라벨링 형식 JSON 데이터 활용 서비스 스마트 축사를 위한 인공지능 서비스, 축사 자동화 시스템 등 데이터 구축년도/
데이터 구축량2021년/● Bbox: 678,841건 (목표구축량 : 500,000건) ● Keypoint: 100,294건 (목표구축량 : 100,000건) ● 음성: 1,260건 (목표구축량 : 1,000건) -
데이터 구축 규모
데이터 구축 규모 형태 Bounding box keypoint 음성 구축량 678,841건
(목표구축량 : 500,000건)100,294건
(목표구축량 : 100,000건)1,260건
(목표구축량 : 1,000건)
클래스별 데이터 분포
• Bounding box클래스별 데이터 분포 구분 개체
(대분류)카테고리
(중분류)세부 카테고리
(소분류)수량
(장, 건, 분)구성 비율 젖소 젖소 이미지
(사육단계)포유기 걷기 8,375(장) 1.23% 서기 7,693(장) 1.13% 휴식 9,810(장) 1.44% 섭식 7,549(장) 1.11% 수면 7,744(장) 1.14% 털손질 7,512(장) 1.11% 머리흔듦 7,878(장) 1.16% 꼬리흔듦 7,920(장) 1.17% 이유기 걷기 7,844(장) 1.15% 서기 9,090(장) 1.34% 휴식 9,061(장) 1.33% 섭식 8,747(장) 1.29% 수면 18,399(장) 2.71% 털손질 7,780(장) 1.15% 머리흔듦 7,912(장) 1.16% 꼬리흔듦 8,827(장) 1.30% 육성기 걷기 8,036(장) 1.18% 서기 13,323(장) 1.96% 휴식 7,829(장) 1.15% 섭식 12,963(장) 1.91% 수면 7,726(장) 1.14% 털손질 9,818(장) 1.45% 머리흔듦 8,185(장) 1.20% 꼬리흔듦 8,059(장) 1.19% 초임우 걷기 9,093(장) 1.34% 서기 12,194(장) 1.79% 휴식 15,266(장) 2.25% 섭식 10,442(장) 1.54% 엉덩이 및 지제 7,511(장) 1.11% 수면 7,536(장) 1.11% 털손질 8,825(장) 1.30% BCS 9,491(장) 1.40% 경산우 걷기 7,759(장) 1.14% 서기 12,807(장) 1.89% 휴식 12,388(장) 1.82% 섭식 7,744(장) 1.14% 엉덩이 및 지제 8,412(장) 1.24% 수면 9,921(장) 1.46% 털손질 7,568(장) 1.11% BCS 7,989(장) 1.18% 합계 373,026(장) 54.91% 착유 젖소
이미지
(비유단계)비유초기 29,000(장) 4.27% 비유중기 25,138(장) 3.70% 비유후기 72,311(장) 10.64% 건유기 25,000(장) 3.68% 합계 151,449(장) 22.29% 젖소 유방
이미지
(비유단계)비유초기 55,457(장) 8.16% 비유중기 37,928(장) 5.58% 비유후기 33,420(장) 4.92% 건유기 28,070(장) 4.13% 합계 154,875(장) 22.80% Bbox 이미지 총 합계 679,350(장) 100.00% • Keypoint
Keypoint 구분 개체(대분류) 카테고리
(중분류)
수량
(장, 건, 분)
구성 비율 젖소 젖소 이미지
(사육단계)걷기 11,856(장) 11.74% 서기 14,082(장) 13.94% 휴식 12,969(장) 12.84% 섭식 12,753(장) 12.63% 수면 13,963(장) 13.83% 털손질 12,425(장) 12.30% 머리흔듦 10,820(장) 10.71% 꼬리흔듦 12,118(장) 12.00% Keypoint 이미지 총 합계 100,986(장) 100.00% • 음성
음성 구분 대분류 중분류 수량
(장, 건, 분)
구성 비율 음성 발정상태 확인을 위한
젖소 음성 데이터정상 630(건) 50% 발정 630(건) 50% 합계 1,260(건) 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드이미지(Bounding box) 객체 검출
이미지(Bounding box) 객체 검출 항목명 바운딩박스 객체 인식(병아리 및 성계 이미지) 목적 Object Detection 학습 알고리즘 DetectoRS 측정 지표 mAP 측정 산식 이미지(Keypoint) 객체 검출
이미지(Keypoint) 객체 검출 항목명 키포인트 객체 인식(성계 이미지) 목적 Keypoint detection 학습 알고리즘 HRNet 측정 지표 OKS 기반 AP 측정 산식 이미지(Keypoint) 행동 인식
caption>이미지(Keypoint) 행동 인식
항목명 행동 인식 목적 Action recognition 학습 알고리즘 PoseC3D 측정 지표 Accuracy 측정 산식 TP: 모델이 true인 것을 true라고 찾은 것
TN: 모델이 false인 것을 false라고 찾은 것
FP: 모델이 true인 것을 false라고 찾은 것
FN: 모델이 false인 것을 true라고 찾은 것음성 분류
음성 분류 항목명 음성 분류 목적 음성 인식 학습 알고리즘 CNN
*CNN은 이미지 처리를 목적으로 개발되었기 때문에 CNN 학습의 input으로
적합하도록 1차원 데이터(오디오)에서 Log mel spectrum을 추출하여 이미지화측정 지표 Accuracy 측정 산식 TP: 모델이 true인 것을 true라고 찾은 것
TN: 모델이 false인 것을 false라고 찾은 것
FP: 모델이 true인 것을 false라고 찾은 것
FN: 모델이 false인 것을 true라고 찾은 것 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 행동 인식 Action Recognition DetectoRS, PoseC3D, CNN 기반 자체 개발 알고리즘 Accuracy 80 % 97.21 % 2 음성 인식 Speech Recognition DetectoRS, PoseC3D, CNN 기반 자체 개발 알고리즘 Accuracy 90 % 94.45 % 3 바운딩박스 객체 검출 (젖소 이미지) Object Detection DetectoRS, PoseC3D, CNN 기반 자체 개발 알고리즘 mAP 90 % 97.32 % 4 바운딩박스 객체 검출 (젖소유방 이미지) Object Detection DetectoRS, PoseC3D, CNN 기반 자체 개발 알고리즘 mAP 90 % 97.07 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드이미지 파일 구성 형식
• 구조
- 농가명_클래스_채널_사육단계 및 비유단계_영상추출날짜_작업자 고유번호_이미지 번호
• 상세 내용상세 내용 농가명 - 농가에서 추출되는 영상을 기준으로 작성
- seoul, hwarang, sim-u, keumsung, hyowon, morang, wondang, mirinae, daeyoung, eunhye,
yeonam, lodaem, kangun, seungyeon, hyunggyu클래스 - 클래스에 해당되는 젖소(dairy-cattle), 착유젖소(milking-cow), 젖소유방(cow-udder)으로 구성 채널 - 농가에 설치된 CCTV별 채널 번호
(ch01~ch28)사육단계 및
비유단계- 젖소 (사육단계) : 포유기(suckling), 이유기(weaning), 육성기(growing), 초임우(heifers), 경산우(cows)
- 착유 젖소(비유단계) : 비유초기(early-lactation), 비유중기(mid-lactation), 비유후기(late-lactation), 건유기(dry-period)
- 젖소 유방(비유단계) : 비유초기(early-lactation), 비유중기(mid-lactation), 비유후기(late-lactation), 건유기(dry-period)영상추출
날짜- CCTV 영상 추출프로그램에서 녹화한 날짜
- yymmdd
작업자
고유번호- 작업자 고유번호의 경우 작업자에게 부여되는 번호(01~) 이미지
번호- 10분 영상을 기준으로 1초로 4FPS로 이미지 추출을 한 이미지 번호(01~2400) • 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수 여부 설명 범위 비고 1 info Object 데이터셋정보 1-1 name string Y 데이터셋명 [dairy-cattle, milking-cow, cow-udder] 1-2 description string 데이터셋 상세설명 1-3 url string URL 2 image Object 이미지정보 2-1 filmingSite string Y 촬영지분류 [1 ~ 28] · 농장마다 설치되는CCTV 개수가 상이함 2-2 event string 이벤트분류 1 ~ 10000 · 젖소에 행동에 따라 이벤트로 판단하여CCTV에 별도로 녹화가 되는 부분이지만 I12정확하게 이벤트가 시작되고 종료되는 부분이 젖소뿐만아니라 이벤트에 해당 하는 경우가 많이 발생하여 필수요소에서 제외한 상황
· 1~10,000의 경우 이벤트 횟수를 의미2-3 width number Y 이미지너비 [0 ~ 2592] 2-4 height number Y 이미지높이 [0 ~ 1944] 2-5 fileName string Y 이미지파일명 [붙임 ➀] · 이미지 데이터3종(젖소, 착유 젖소, 젖소 유방) 중 젖소에만 3-7에 해당하는 action의 값을 기입 할 수 있음
· Action을 기입 할 수 있는 경우, 사육단계로 구분
- Action을 기입 할 수 없는 경우, 비유단계로 구분2-6 created string Y 이미지촬영일자 YYMMDD - [210901~20211231] 3 annotationImageInfo Object 라벨링 이미지정보 3-1 farmID string Y 농장이름 [붙임 ②] 3-2 breedingType string Y 사육형태 [raise, graze] 3-3 farmScale number Y 사육동수 [1 ~ 15] 3-4 headCount number Y 사육두수 [1 ~ 200] 3-5 breedingStage string Y 사육단계 [붙임 ②] 3-6 lactationStage string Y 비유단계 [붙임 ②] 3-7 action string Y 행동 [붙임 ②] ※ 이때 [2.2.1 라벨 구성요소 3-7, "action"] 값은 해당 이미지 내 bounding box 수행된 객체의 행동들 중 랜덤으로 부여함 3-8 meal string 급이방식 [manual, auto] 3-9 drink string 급수방식 [manual, auto] 3-10 feed string 사료정보 [붙임 ②] 3-11 withersHeight number 체고 [1 ~ 200] 3-12 chest number 흉위 [1 ~ 200] 4 annotationObjectInfo Array 라벨링 객체정보 4-1 actionValue boolean Y action 값의 행동 판단 여부 [true, false] · true : 3-7에서 라벨링되는 정보에 해당하는 행동을 취할 경우
· false : 3-7에서 라벨링되는 정보에 해당하는 행동을 취하지 않을 경우4-2 BBox Array Y 바운딩박스 정보 · Bounding Box의 좌상단 x좌표, 좌상단 y좌표, 너비, 높이 순으로 구성 4-3 keypoints Array 키포인트 정보 · keypoint의 x좌표, y좌표, score 순
· score란 각 키포인트의 상태를 나타내는 값
· 2 : 일반적인 값. 육안으로 확인이 가능하며 라벨링을 진행
· 1 : 객체끼리 겹쳐지거나 카메라 앵글로 인해 해당 키포인트가 육안으로 확인되지는 않을 경우
· 0 : 해당 점이 카메라 밖에 존재해 찍히지 않은 경우4-4 num_keypoints number 키포인트 개수 [18, 7] 4-5의 category가 ‘side’인 경우 18, 4-5의 category가 ‘back’인 경우 7 4-5 category String Y 클래스 정보 [dairy-cattle, milking-cow, cow-udder] ※단, keypoint 수행한 Object의 경우, 객체의 방향이 기입됨.
[‘side’, ‘back’]4-6 isCrowd number 객체겹침 여부 [0, 1] • 데이터예시
데이터예시 원천데이터 라벨링데이터 {
"info": {
"name": "dairy-cattle",
"description": "",
"url": ""
},
"image": {
"filmingSite": "07",
"event": "",
"width": 2592,
"height": 1824,
"fileName": "hyunggyu_dairy-cattle_ch07_cows_210924_048_0638.png",
"created": "210924"
},
"annotationImageInfo": {
"farmID": "hyunggyu",
"breedingType": "raise",
"farmScale": 10,
"headCount": 146,
"breedingStage": "cows",
"lactationStage": "",
"action": "standing",
"meal": "",
"drink": "",
"feed": "",
"withersHeight": "",
"chest": ""
},
"annotationObjectInfo": [
{
"actionValue": false,
"BBox": [
2285,
661,
216,
219
],
"category": "dairy-cattle",
"isCrowd": 0
},
{
"actionValue": true,
"BBox": [
1336,
995,
331,
514
],
"category": "dairy-cattle",
"isCrowd": 0
},
{
"actionValue": true,
"BBox": [
789,
957,
294,
402
],
"category": "dairy-cattle",
"isCrowd": 0
}
]
}음성파일 구성 형식
• 구조
- 작업자 번호_농가명_데이터 셋명_양계 음성_생애주기_음성 번호
• 상세 내용상세 내용 작업자 번호 - 작업자 고유번호의 경우 작업자에게 지급되는 번호 (001~010) 농가명 - 해당하는 음성 데이터가 수집되는 농가명
- gunji, buan, elim, greenmiso, neunggir, deunggogae, gageum, pangyo, gyeyong,
myoungcheon데이터셋명 - 젖소(dairy-cattle) 젖소 음성 - 정상(normal), 발정(oestral) 생애 주기 - 젖소 (사육단계) : 포유기(suckling), 이유기(weaning), 육성기(growing),
초임우(heifers), 경산우(cows)음성번호 - 가공되는 음성의 번호(001~) • 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수
여부설명 범위 비고 1 info Object 데이터셋정보 1-1 name string Y 데이터셋명 [dairy-cattle] 1-2 description string 데이터셋상세설명 1-3 url string URL 2 audioInfo Object 음성정보 2-1 samplingRate number 주파수 [48khz] 2-2 bit number 비트수 [24bit] 2-3 byteOrder number 바이트정보 2-4 fileName string Y 파일이름 [붙임 ➀] 2-5 fileLength number Y 파일길이 [1 ~ 60] 2-6 fileFormat string Y 파일포맷 wav 2-7 timeInterval number 녹음주기 3 annotationInfo Object 라벨링정보 3-1 farmID string Y 농장이름 [붙임 ②] 3-2 breedingType string Y 사육형태 [raise, graze] 3-3 farmScale number Y 사육동수 [1 ~ 15] 3-4 headCount number Y 사육두수 [1 ~ 200] 3-5 breedingStage string Y 사육단계 [붙임 ②] 3-6 meanHertz string Y 음성파일 평균헤르츠 3-7 segmentalVoice string Y 분절음성 클래스 [normal, oestral] -
데이터셋 구축 담당자
수행기관(주관) : ㈜티맥스티베로
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박윤수 031-8018-9398 [email protected] 과제 총괄 및 데이터 처리 수행기관(참여)
수행기관(참여) 기관명 담당업무 한경대학교 산학협력단 농가확보, 데이터수집 및 육안 검수 ㈜리얼팜 저작툴 제공 및 센서 데이터 수집 및 크라우드 워커 교육, 데이터 라벨링 경북ICT융합산업진흥협회 크라우드 소싱 공급 및 교육, 데이터 정제 충남대학교 산학협력단 데이터 정제 및 검수 ㈜올림커뮤니케이션즈 정제, 검수 도구 개발, 라벨링 툴 개발, AI학습 모델 및 알고리즘 개발, 데이터 라벨링
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.