콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#컴퓨터 비전

비전영역, 음식이미지 및 정보소개 텍스트 데이터

비전영역, 음식이미지 및 정보소개 텍스트 데이터 아이콘 이미지
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 10,897 다운로드 : 274 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-15 데이터 최종 개방
    1.0 2023-07-31 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-02-27 저작도구 수정
    2023-12-15 산출물 전체 공개

    소개

    AI허브 제공 중인 비전 분야 음식이미지 및 영양정보 데이터셋을 구성하는 원천데이터를 다양한 음식으로 확장 구축하고, 음식분류와 양 인식을 위한 원천 및 라벨링 데이터 등을 추가, 보완하여 데이터의 유용성과 활용도를 높이기 위한 데이터 고도화

    구축목적

    기 구축되어있는 음식이미지데이터의 경우, 한식메뉴 중심에 국한되다 보니 빠르게 변화하는 식문화 트랜드를 반영하지 못함 다양한 퀴진을 포함하여 폭넓은 가격대의 외식메뉴, 요즘의 식생활 형태를 반영할 수 있는 800종의 음식을 구축
  • 1. 데이터 구축 규모
    총 네 개의 카테고리로 분류된 특수외식메뉴, 일반외식·배달메뉴, 끼니대체메뉴, 음료 및 차류 등 이미지 데이터 및 영양정보 텍스트데이터

    데이터 구축 규모
    분류 메뉴 수 (종) 구축 이미지 수 (장) 데이터 유형
    특수외식메뉴  200 81,140 jpg / json
    일반외식·배달메뉴 300 80,590 jpg / json
    끼니대체메뉴 200 61,300 jpg / json
    [빵,떡,죽및스프류]
    음료 및 차류 100 9,057 jpg / json
    합계 800 232,087  

     

    2. 데이터 분포
    1) 음식 대분류 카테고리 분포

    데이터 분포 - 음식 대분류 카테고리 분포
    대분류 카테고리명 구성 수 구성비율
    특수외식메뉴 81,140 35.00%
    일반외식·배달메뉴 80,590 34.70%
    끼니대체메뉴 61,300 26.40%
    [빵, 떡, 죽 및 수프류]
    음료 및 차류 9,057 3.90%
    합계 232,087 100.00%

     

    2) 음식 중분류 카테고리 분포
    음식 중분류 카테고리 분포

    3) 촬영 각도 분포

    촬영 각도 분포

     

     

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    모델 학습
    기존의 Pascal VOC 데이터셋 타입을 음식 데이터셋에 적합하게 개선하여 커스텀 음식 데이터셋을 정의하였다. 해당 데이터셋은 8:1:1 비율로 Train / Vaildation / Test 용 데이터셋으로 활용되었다.

     
    모델 학습
    데이터셋 Train Vaildation Test
    분류 방식 약 23만 장의 이미지 중 랜덤 샘플링을 통해 아래 비율로 데이터셋을 구분하였음
    비율 8 1 1

     

    - 수집된 학습용 데이터에서 라벨링 된 2D 및 3D 바운딩박스는 학습서버를 통해 음식탐지 및 분류모델과 중량예측 모델을 개발
    수집된 학습용 데이터에서 라벨링 된 2D 및 3D 바운딩박스는 학습서버를 통해 음식탐지 및 분류모델과 중량예측 모델을 개발

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 음식 탐지 성능 Object Detection Faster-RCNN (Backbone – SwinTransformer) mAP 65 % 74.58 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 포맷
    4개의 대분류, 14개의 중분류 800종의 원천데이터로 이뤄져 있음

    데이터 포맷
    No Field name meaning
    a 대분류 특수외식메뉴, 일반외식 및 배달음식, 끼니 대체 메뉴, 음료 및 차류
    b 중분류 향토음식, 외국음식, 배달음식, 일반외식, 떡, 빵, 죽, 수프, 기타, 과일 및 과채음료, 유제품, 잎차류, 커피류
    c 메뉴명 800종 메뉴

     

    데이터 구성

    데이터 구성
    대분류 중분류 소분류 구분1 구분2
    특수외식메뉴 향토음식 메뉴명 표본번호 촬영 각도
    일반음식
    일반외식 및 배달음식 배달음식
    일반외식
    끼니 대체 메뉴
    수프
    샌드위치
    기타
    음료 및 차류 과일 및 과채음료
    유제품
    잎차류
    커피류

     

    예시
    A 13 A13001 가자미구이 1 1 .JPG
    대분류코드 중분류코드 Keycode 음식명 표본번호 촬영각도 파일형식

     

    어노테이션 형식

    어노테이션 형식
    구분 항목명 타입 필수 설명 비고
    1 data            
       1-1 image_info            
       1-1-1 file_name string y 이미지 파일명   
    1-1-2 width number y 데이터셋 가로 해상도   
    1-1-3 height number y 데이터셋 세로 해상도   
    1-1-4 weight number y 실중량 (g)   
    1-1-5 s_weight number y 1인분 표준 중량(g)   
       2-1 2d_annotation            
       2-1-1 x number y 바운딩박스 x 좌표   
    2-1-2 y number y 바운딩박스 y 좌표   
    2-1-3 width number y 바운딩박스 가로 픽셀 길이   
    2-1-4 height number y 바운딩박스 세로 길이   
       3-1 3d_annotation            
       3-1-1 x list (number) y cuboid 꼭짓점 8개의 x 좌표   
    3-1-2 y list (number) y cuboid 꼭짓점 8개의 y 좌표   
       4-1 nutrition            
       4-1-1 stand number y 업장 고유 레시피 (0) / 표준 레시피 (1)   
    4-1-2 g number y 기준 단위 (g) 100g
    4-1-3 e number y 에너지 영양정보 값의 "-99"는 데이터가 존재하지 않음을 의미
    4-1-4 cal number y 탄수화물
    4-1-5 sug number y 당류
    4-1-6 fat number y 지질
    4-1-7 pro number y 단백질
    4-1-8 na number y 나트륨
    4-1-9 chol number y 콜레스테롤
    4-1-10 total_sfa number y 총 포화지방산
    4-1-11 total_tfa number y 총 트랜스지방산
       5-1 food_type            
       5-1-1 fc string y 음식 분류 정보   
    5-1-2 vg string y 채식 단계 정보   
    5-1-3 cs string y 퀴진 정보   
    5-1-4 si list(string) y 사용 양념 정보   
    5-1-5 loc string y 향토 음식 정보   
       6-1 restaurant            
       6-1-1 name string n 상호명   
    6-1-2 addr string n 도로명 주소   

     

    실제 예시 이미지 데이터실제예시 JSON 형식

    이미지 데이터            JSON 형식
     

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜네스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    유요식 042-537-7752 [email protected] 원시데이터 수집/정제 업무
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜씨엔에이아이 학습 알고리즘 개발, 3D BBOX 오토라벨링툴 개발
    ㈜어메이징푸드솔루션 영양정보 및 부가정보 구축
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    유요식 042-537-7752 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.