콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#동의보감 약초 이미지 # 약초 텍스트 데이터 # 약초 판별 서비스 # 허브넷

동의보감 약초 이미지

동의보감 약초 이미지
  • 분야농축수산
  • 유형 텍스트 , 이미지
구축년도 : 2020 갱신년월 : 2021-06 조회수 : 6,807 다운로드 : 759 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2021-06-25 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-09-13 저작도구 수정 저작도구 소스코드 개방
    2022-10-12 신규 샘플데이터 개방

    소개

    동의보감에 수록된 약초 457종(2020년도 50종 선정) 약초를 판별하기 위한 이미지 데이터

    구축목적

    약초 및 독초 판별을 위한 이미지 AI 데이터와 약초 사용법 제공을     위한 효능 데이터를 구축하고 약초 및 독초 판별 인공지능 알고리즘을     개발하여 약초 판별 인공지능 동의보감 애플리케이션 개발 및 배포
  • 구축 내용 및 제공 데이터량

    • 대상 약초 선정
      - 식물 및 한의학 전문가 자문을 통해 동의보감 수록 약초 457종 중 2020년 사업 대상으로 50종을 선정하고, 선정 약초와 형태, 모양 등이 매우 유사한 78종의 식물을 비교식물로 선정
    • 데이터 수집
      - 수행기관 및 참여기관인 ㈜동북아생물다양성연구소는 대상 약초 및 비교식물의 표준 가이드 라인를 제시하고, 참여기관인 ㈜믹스미디어, ㈜빅스톤하우스는 촬영 매뉴얼에 따라 직접 촬영하여 846,277(구축 계획 133% 달성)건의 데이터를 수집
    • 데이터 정제
      - 수행기관의 자문을 거쳐 만들어진 정제 매뉴얼에 따라 참여 기관인 ㈜빅스톤하우스는 수집된 데이터를 기술 검증(3단계)하고 전문가 검수를 통해 최종 정제를 완료함으로써 품질 높은 665,267건의 정제된 데이터를 확보
    • 데이터 가공 및 검수
      - 데이터 가공 매뉴얼에 따라 저작도구인 LableMe를 이용하여 바운딩 박싱, Crop, Annotation하여 661,369건의 학습용 데이터 구축
      구축 내용 및 제공 데이터량 표
      구 분 2020 년
      목표(A) 달성(B) 달성률(B/A)
      이미지
      데이터 구축
      수집 637,950장 846,277장 133%
      정제 637,950장 665,267장 104%
      가공 637,950장 661,369장 103%
      수집 플랫폼 1식 1식 100%
      약초 텍스트
      데이터 구축
      약초효능 12,000건 12,000건 100%
      네레이션 250건 250건 100%
      번역 200건 200건 100%
      러시아, 영어, 일어, 중국어
      녹음 250건 250건 100%
      한국, 러시아, 일어, 중국어, 영어
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 다운로드
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 약초 인식 정확도 Image Classification DenseNet169 F1-Score(mean) 0.5 0.96

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2021.06.25 데이터 최초 개방  

    구축 목적

    • 약초 및 독초 판별을 위한 이미지 AI 데이터와 약초 사용법 제공을     위한 효능 데이터를 구축하고 약초 및 독초 판별 인공지능 알고리즘을     개발하여 약초 판별 인공지능 동의보감 애플리케이션 개발 및 배포

    활용 분야

    • 교육, 농업, 환경, 문화 등 여러 분야에서 사용 가능한 식물 판별 기     초 데이터셋

    소개

    • 독초·약초 오용으로 인한 중독사고 예방을 통한 생활·안전 문제 해결 기여
    • 동의보감 기반 정확한 약초 활용 AI 모델 제시, 국민건강 100세시대 기여
    • 약초 판별 인공지능 분야 국제 표준화 분류 코드 체계 수립 여건 마련

    동의보감 약초 이미지 소개 이미지

    구축 내용 및 제공 데이터량

    • 대상 약초 선정
      - 식물 및 한의학 전문가 자문을 통해 동의보감 수록 약초 457종 중 2020년 사업 대상으로 50종을 선정하고, 선정 약초와 형태, 모양 등이 매우 유사한 78종의 식물을 비교식물로 선정
    • 데이터 수집
      - 수행기관 및 참여기관인 ㈜동북아생물다양성연구소는 대상 약초 및 비교식물의 표준 가이드 라인를 제시하고, 참여기관인 ㈜믹스미디어, ㈜빅스톤하우스는 촬영 매뉴얼에 따라 직접 촬영하여 846,277(구축 계획 133% 달성)건의 데이터를 수집
    • 데이터 정제
      - 수행기관의 자문을 거쳐 만들어진 정제 매뉴얼에 따라 참여 기관인 ㈜빅스톤하우스는 수집된 데이터를 기술 검증(3단계)하고 전문가 검수를 통해 최종 정제를 완료함으로써 품질 높은 665,267건의 정제된 데이터를 확보
    • 데이터 가공 및 검수
      - 데이터 가공 매뉴얼에 따라 저작도구인 LableMe를 이용하여 바운딩 박싱, Crop, Annotation하여 661,369건의 학습용 데이터 구축
      구축 내용 및 제공 데이터량 표
      구 분 2020 년
      목표(A) 달성(B) 달성률(B/A)
      이미지
      데이터 구축
      수집 637,950장 846,277장 133%
      정제 637,950장 665,267장 104%
      가공 637,950장 661,369장 103%
      수집 플랫폼 1식 1식 100%
      약초 텍스트
      데이터 구축
      약초효능 12,000건 12,000건 100%
      네레이션 250건 250건 100%
      번역 200건 200건 100%
      러시아, 영어, 일어, 중국어
      녹음 250건 250건 100%
      한국, 러시아, 일어, 중국어, 영어

    대표도면

    • 약초 판별 알고리즘과 3D 이미지를 활용하여 약초 판별 인공지능 동의보감 스마트폰 앱 개발
      - 운영체계: Android
      - 데이터셋: 약초 및 비교식물 128종, 660,000장
      - 방식: 카메라로 촬영한 사진을 AI 알고리즘을 통해 판별
      - 카테고리: 라이프 스타일
      - 앱명칭: 허브넷(약초 판별 인공지능 동의보감)
      - 지원언어: 한국어, 영어, 중국어, 러시아어, 일본어

    동의보감 약초 이미지 대표도면 이미지

     

    필요성

    • 자연 약초의 맹신에 따른 안전 불감증, 국민건강 위협
      - 한방 의료기관에서 진단·처방받아 복용하는 한약은 안전관리가 체계적이며 의료인의 지도·관리가 이루어지고 있으나, 민간에서 채취·복용하는 약초는 전적으로 개인의 책임
    • 자연 약초에 대한 부정확한 정보와 오용으로 인한 피해 증가 - 산과 들에 자생하는 약초는 일반인의 접근성이 높은 반면, 부정확한 정보로 인한 생명에 대한 안전 보장에 대한 우려가 높음
      ※ 식품의약품안전처 통계에 따르면, 최근 10년간(2009년~2018년) 자연 독에 의한 사망 251명
    • 생활 속 자연 약초 안전 이용 기준 및 정확한 판별에 대한 도움 제공 필요
      - 개인의 약초 채취·복용을 금지할 수 없는 실정으로 최소한의 안전장치로 약초 채취 전과 약초 음용 전에 약초에 대한 판별과 정확한 활용 방법에 대한, 확인 수단 필요
    • 파급효과
      - 유사 약초 구분과 판별에 도움을 줄 수 있는 인공지능을 개발하여 전문 지식 부족으로 독초를 약초로 오인·음용하여 발생되는 ‘독에 의한 사망과 중독사고’ 예방
      - 동의보감의 현대적 해석과 생활 속 활용 인공지능 모델 제시
      - 자연 약초의 정확한 사용 및 활용 방법 제공을 통한 국민 건강 생활 지원
      - 동의보감 약초의 방대한 비정형 데이터의 정형화 데이터셋 구축을 통해 다양한 AI 연구 견인
      - 약초를 이용한 개인맞춤형 건강관리 모델 발굴 등 고령화 사회 문제 해결 기여

    데이터 구조

    • 데이터 구성
      동의보감 약초 이미지 데이터 구성 표
      Key Description Type
      width 연관 이미지 파일의 가로 픽셀수 int
      height 연관 이미지 파일의 세로 픽셀수 int
      filename 연관 이미지 파일의 식별자(이름) string
      kind 연관 이미지 파일에 촬영된 약초의 종류 string
      part 연관 이미지 파일에 촬영된 약초의 부위명 string
      gps_long 연관 이미지 파일에 촬영된 약초의 위도 좌표 float
      gps_lat 연관 이미지 파일에 촬영된 약초의 경도 좌표 float
      place 연관 이미지 파일에 촬영된 장소의 이름 string
      date 연관 이미지 파일에 촬영된 시점 string
      is_copyright 저작권자에게 사용 동의를 받았는지에 대한 여부 boolean
      is_compare 현재 식물이 비교식물에 해당하는 약초인지의 여부 boolean
      is_poisonous 현재 식물이 독성을 가지고 있는지 여부 boolean
      manufacture 촬영 장비의 제조사 명(ex:cannon) string
      model 촬영장비의 모델명 string
      flash 플래쉬 작동 여부 boolean
      focal_length 촬영시 초점 여부 string
      exposure_time 촬영시 셔터 거리 string
      ISO 촬영시 ISO 감도 string
      resolution 촬영시 I해상도 string
      f_number 촬영시 F값 string
      aperture_value 촬영시 조리개 값 string
      depth 연관 이미지 파일의 채널 수 int
      bit 연관 이미지 파일의 비트 수 int
      tag 연관 이미지 파일의 연관 정보 int

       

    • 어노테이션 포맷
      데이터 구조 어노테이션 포맷표
      No 항목 필수여부 타입
      국문명 영문명
      1 1-1 이미지 길이 width Y Int
      1-2 이미지 높이 height Y Int
      1-3 식별자 filename Y String
      2 2-1 약초명 kind Y String
      2-2 부위명 part N String
      2-3 위도 gps_long N Float
      2-4 경도 gps_lat N Float
      2-5 촬영장소 place N String
      2-6 촬영일시 date Y String
      2-7 저작권 동의 여부 is_copyright Y Boolean
      2-8 비교식물 여부 is_compare Y Boolean
      2-9 독초 여부 is_poisonous Y Boolean
      2 3-1 제조사 manufacturer N String
      3-2 모델명 model N String
      3-3 플래시 flash N Boolean
      3-4 초점 거리 focal_length N String
      3-5 셔터 속도 exposure_time N String
      3-6 ISO 감도 ISO N String
      3-7 해상도 resolution N String
      3-8 F 값 f_number N String
      3-9 조리개값 aperture_value N String
      3-10 채널 depth N Int
      3-11 비트 bit N Int
      4 태그 tag N List
  • 데이터셋 구축 담당자

    수행기관(주관) : 가천대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이영종 031-750-5413 [email protected] · 약초 이미지 데이터 구축, 약초 텍스트 데이터 구축 · 원천 데이터 정제 검수 · 데이터 구축 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    빅스톤하우스 · 데이터 수집, 데이터 정제, 데이터 라벨링, 판별 알고리즘 설계
    · 허브넷 플랫폼 개발, 응용 서비스(약초 판별 앱)개발
    고백기술 · 수집 데이타 가공(라벨링 및 어노테이션)
    · 학습용 데이터 검수 및 품질관리
    · 크라우드소싱 인력 교육 진행 및 관리
    · AI 학습 알고리즘 선정 및 AI 학습 모델 구축(신경망 모델 학습)
    · 약초판별 알고리즘 개발
    믹스미디어 · 원시 데이터 구축
    · 텍스트데이터 5개 국어 번역
    나인펄스 · 약초 3D 모델링 제작(50종)
    · 나래이션 녹음(300건-한국어, 영어, 러시아어, 중국어, 일어)
    동북아생물다양성연구소 · 원시 데이터 수집
    · 원천 데이터 전문가 검수
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김병철(빅스톤하우스) 070-4632-7800 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.