비전영역, 음식이미지 및 정보소개 텍스트 데이터
- 분야영상이미지
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-02-27 저작도구 수정 2023-12-15 산출물 전체 공개 소개
AI허브 제공 중인 비전 분야 음식이미지 및 영양정보 데이터셋을 구성하는 원천데이터를 다양한 음식으로 확장 구축하고, 음식분류와 양 인식을 위한 원천 및 라벨링 데이터 등을 추가, 보완하여 데이터의 유용성과 활용도를 높이기 위한 데이터 고도화
구축목적
기 구축되어있는 음식이미지데이터의 경우, 한식메뉴 중심에 국한되다 보니 빠르게 변화하는 식문화 트랜드를 반영하지 못함 다양한 퀴진을 포함하여 폭넓은 가격대의 외식메뉴, 요즘의 식생활 형태를 반영할 수 있는 800종의 음식을 구축
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 이미지 라벨링 유형 바운딩박스(이미지) , 영양정보(텍스트) 라벨링 형식 json 데이터 활용 서비스 식단 관리 앱, 헬스케어 서비스 등 데이터 구축년도/
데이터 구축량2022년/232,087장 -
1. 데이터 구축 규모
총 네 개의 카테고리로 분류된 특수외식메뉴, 일반외식·배달메뉴, 끼니대체메뉴, 음료 및 차류 등 이미지 데이터 및 영양정보 텍스트데이터데이터 구축 규모 분류 메뉴 수 (종) 구축 이미지 수 (장) 데이터 유형 특수외식메뉴 200 81,140 jpg / json 일반외식·배달메뉴 300 80,590 jpg / json 끼니대체메뉴 200 61,300 jpg / json [빵,떡,죽및스프류] 음료 및 차류 100 9,057 jpg / json 합계 800 232,087 2. 데이터 분포
1) 음식 대분류 카테고리 분포데이터 분포 - 음식 대분류 카테고리 분포 대분류 카테고리명 구성 수 구성비율 특수외식메뉴 81,140 35.00% 일반외식·배달메뉴 80,590 34.70% 끼니대체메뉴 61,300 26.40% [빵, 떡, 죽 및 수프류] 음료 및 차류 9,057 3.90% 합계 232,087 100.00% 2) 음식 중분류 카테고리 분포
3) 촬영 각도 분포
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델 학습
기존의 Pascal VOC 데이터셋 타입을 음식 데이터셋에 적합하게 개선하여 커스텀 음식 데이터셋을 정의하였다. 해당 데이터셋은 8:1:1 비율로 Train / Vaildation / Test 용 데이터셋으로 활용되었다.모델 학습 데이터셋 Train Vaildation Test 분류 방식 약 23만 장의 이미지 중 랜덤 샘플링을 통해 아래 비율로 데이터셋을 구분하였음 비율 8 1 1 - 수집된 학습용 데이터에서 라벨링 된 2D 및 3D 바운딩박스는 학습서버를 통해 음식탐지 및 분류모델과 중량예측 모델을 개발
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 음식 탐지 성능 Object Detection Faster-RCNN (Backbone – SwinTransformer) mAP 65 % 74.58 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 포맷
4개의 대분류, 14개의 중분류 800종의 원천데이터로 이뤄져 있음데이터 포맷 No Field name meaning a 대분류 특수외식메뉴, 일반외식 및 배달음식, 끼니 대체 메뉴, 음료 및 차류 b 중분류 향토음식, 외국음식, 배달음식, 일반외식, 떡, 빵, 죽, 수프, 기타, 과일 및 과채음료, 유제품, 잎차류, 커피류 c 메뉴명 800종 메뉴 데이터 구성
데이터 구성 대분류 중분류 소분류 구분1 구분2 특수외식메뉴 향토음식 메뉴명 표본번호 촬영 각도 일반음식 일반외식 및 배달음식 배달음식 일반외식 끼니 대체 메뉴 떡 빵 죽 수프 샌드위치 기타 음료 및 차류 과일 및 과채음료 유제품 잎차류 커피류 예시 A 13 A13001 가자미구이 1 1 .JPG 대분류코드 중분류코드 Keycode 음식명 표본번호 촬영각도 파일형식 어노테이션 형식
어노테이션 형식 구분 항목명 타입 필수 설명 비고 1 data 1-1 image_info 1-1-1 file_name string y 이미지 파일명 1-1-2 width number y 데이터셋 가로 해상도 1-1-3 height number y 데이터셋 세로 해상도 1-1-4 weight number y 실중량 (g) 1-1-5 s_weight number y 1인분 표준 중량(g) 2-1 2d_annotation 2-1-1 x number y 바운딩박스 x 좌표 2-1-2 y number y 바운딩박스 y 좌표 2-1-3 width number y 바운딩박스 가로 픽셀 길이 2-1-4 height number y 바운딩박스 세로 길이 3-1 3d_annotation 3-1-1 x list (number) y cuboid 꼭짓점 8개의 x 좌표 3-1-2 y list (number) y cuboid 꼭짓점 8개의 y 좌표 4-1 nutrition 4-1-1 stand number y 업장 고유 레시피 (0) / 표준 레시피 (1) 4-1-2 g number y 기준 단위 (g) 100g 4-1-3 e number y 에너지 영양정보 값의 "-99"는 데이터가 존재하지 않음을 의미 4-1-4 cal number y 탄수화물 4-1-5 sug number y 당류 4-1-6 fat number y 지질 4-1-7 pro number y 단백질 4-1-8 na number y 나트륨 4-1-9 chol number y 콜레스테롤 4-1-10 total_sfa number y 총 포화지방산 4-1-11 total_tfa number y 총 트랜스지방산 5-1 food_type 5-1-1 fc string y 음식 분류 정보 5-1-2 vg string y 채식 단계 정보 5-1-3 cs string y 퀴진 정보 5-1-4 si list(string) y 사용 양념 정보 5-1-5 loc string y 향토 음식 정보 6-1 restaurant 6-1-1 name string n 상호명 6-1-2 addr string n 도로명 주소 이미지 데이터 JSON 형식
-
데이터셋 구축 담당자
수행기관(주관) : ㈜네스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 유요식 042-537-7752 [email protected] 원시데이터 수집/정제 업무 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜씨엔에이아이 학습 알고리즘 개발, 3D BBOX 오토라벨링툴 개발 ㈜어메이징푸드솔루션 영양정보 및 부가정보 구축 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 유요식 042-537-7752 [email protected]
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.