콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#컴퓨터 그래픽스

한국 전통 수묵화 화풍별 제작 데이터

한국 전통 수묵화 화풍별 제작 데이터 아이콘 이미지
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2024-01 조회수 : 6,768 다운로드 : 260 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.2 2024-01-31 최종데이터 수정 개방
    1.1 2023-11-17 데이터 최종 개방
    1.0 2023-05-04 데이터 개방 (Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-20 산출물 전체 공개

    소개

    ● 이미지 스타일 변환모델 및 생성모델을 적용한 수묵화 화풍별 제작 이미지 데이터셋
    ● 사극, 뮤직드라마, 광고, 애니메이션 등 콘텐츠 제작에 본 데이터셋 및 유효성 검증모델 활용 가능

    구축목적

    ● 한국 전통수묵화 디지털콘텐츠 제작 활성화 및 인공지능 미술시장 확대
  • 데이터 구축 규모
    수묵화 이미지 총 7,325건, 제작영상 총 200건

    데이터 구축 규모
    구분 세부내역 성과목표
    데이터셋 수집 이미지 데이터 7,325건
    영상 데이터 200건 
    가공/검수 클래스 대상별 분포 풍경 2,228 건
    인물 2,414 건
    사물 2,683 건
    클래스 유형별 분포 실사 사진 3220 건
    애니메이션 이미지 3,174 건
    유명 서양화 931 건 
    표현기법 분포 백묘법-건필 782 건 
    백묘법-중필 903 건
    백묘법-습필 785건
    구륵법-철선-운염 612건
    구륵법-철선-적묵 558건 
    구륵법-난염-운염 613건 
    구륵법-난염-적묵 598건
    몰골법-발묵 1,176 건
    몰골법-파묵 1,298 건
    클래스별 작품 난이도 분포 A 560 건
    B 1,902 건
    C 3,662 건
    D 1,201 건 
    종이 재질에 따른 분포 화선지 3,801 건 
    순지 3,524 건 

     

    *백묘법 : 붓이 머금은 수분 함유량에 따라 달리 표현되는 선의 물 번짐을 이용한 기법
    *구륵법 : 일필휘지 단필 또는 중첩으로 채색하여 표현하는 기법
    *몰골법 : 농묵과 담묵이 중첩되어 표현하거나 붓자국 없이 번짐 활용한 기법

     

    사물 43.19%, 풍경 23.77%, 인물 33.04% 유명서양화 32.46%, 실사 사진 37.10%, 애니메이션30.43% 백묘법 33.33%, 몰골법 33.33%, 구룩법 33.33%
    클래스 대상별 분포 클래스 유형별 분포 표현기법 분포

     

     
     
    항목명 지표 결과
    클래스 대상별분포 목표 구성비 구분 수량 비중
    풍경 28.60% 풍경 246 23.77%
    인물 32.86% 인물 342 33.04%
    사물 38.57% 사물 447 43.19%
      합계 1,035 100%
    클래스 유형별 분포 목표 구성비 구분 수량 비중
    실사 사진 43.93% 실사 사진 384 37.10%
    애니메이션  43.21% 애니메이션  315 30.43%
    이미지 이미지
    유명 서양화 12.86% 유명 서양화 336 32.46%
      합계 1,035 100%
    표현기법 분포 목표 구성비 구분 수량 비중
    백묘법-갈필 11.07% 백묘법-갈필 61 5.89%
    백묘법-중필 11.07% 백묘법-중필 239 23.09%
    백묘법-윤필 11.07% 백묘법-윤필 45 4.35%
    구륵법-철선-운염 8.30% 구륵법-철선-운염 35 3.38%
    구륵법-철선-적묵 8.30% 구륵법-철선-적묵 141 13.62%
    구륵법-난엽-운염 8.30% 구륵법-난엽-운염 72 6.96%
    구륵법-난염-적묵 8.31% 구륵법-난염-적묵 97 9.37%
    몰골법-발묵 16.79% 몰골법-발묵 135 13.04%
    몰골법-파묵 16.79% 몰골법-파묵 210 20.29%
      합계 1,035 100%
    클래스별 작품 난이도 분포 목표 구성비 구분 수량 비중
    A 7.84% A 65 6.28%
    B 27.14% B 168 16.23%
    C 52.16% C 420 40.58%
    D 12.86% D 382 36.91%
      합계 1,035 100%
    종이 재질에 따른 분포 목표 구성비 구분 수량 비중
    화선지 50% 화선지 482 46.57%
    순지 50% 순지 553 53.43%
      합계 1,035 100%

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    ㅇ 활용 AI 모델
        - 인공지능 수묵화 이미지 변환모델(DCGAN) 1개
        - 수묵화 이미지 생성모델(CycleGAN) 1개

    ㅇ 활용 AI 모델
    학습모델 내용 지표 목표치
    DCGAN 이미지 생성(Image Generation Model IS 2 이상) AI 기술을 활용하여 수묵화 이미지에서 새로운 수묵화 이미지 생성 Inception Score 2
    CycleGAN 이미지 스타일 변환(Style Transfer Model AMT Score 20% 이상) 수묵화 이미지의 특성(feature)을 CNN 및 GAN 신경망을 통하여 새로운 이미지를 학습된 스타일을 변경하는 모델 AMT Score, Loss 20,
    3.5

     

     
    구분 고려 사항 설명
    1 적합성 화풍별 제작 데이터셋 구축 목적에 적합한 학습모델인가
    (재료, 기법 등을 달리하여 동일 원본에 대한 상이 컨텐츠 제작)
    2 활용성 사용자의 수묵화 컨텐츠에 대한 접근성이 높은 학습 모델인가
    3 실현가능성 구축된 학습데이터셋을 활용하여 실제 컨텐츠 제작에 적용하고 실현가능성이 높은 모델인가
    4 선정 절차 1) 선정기준에 적합한 후보 리스트업
    2) 각 학습모델 후보군 테스트 1-Cycle 학습모델 개발 및 진행
    3) 성능평가
    4) 모델 관련 코드 작성 및 최종 학습모델 선정


     ① 인공지능을 통한 수묵화 이미지 스타일 변환 모델 - Style Transfer (CycleGan)
    - (개발 목표) 수묵화 이미지의 특성(feature)을 CNN 및 GAN 신경망을 통하여 새로운 이미지를 학습된 스타일을 변경하는 Style Transfer 모델 제시
    - (개발 내용) CycleGAN에서는 각각 2개의 discriminator와 generator가 존재하며, G는 X → Y의 mapping을 수행하고 F는 Y → X의 mapping을 수행. Dx와 Dy는 각각 domain X와 Y의 이미지를 판별함. 이때 생성된 이미지와 실제 이미지 간의 loss를 Adversarial loss로 G와 F의 Matching을 학습시키는 Cycle Consistency loss를 구하는 방식으로 모델 개발


     ② 인공지능을 통한 수묵화 이미지 생성 모델 - Image Generator (DCGAN)
    - (개발 목표)
    인공지능 기술을 활용하여 수묵화 이미지 데이터셋 집합에서 새로운 수묵화 그림을 생성하는 GAN 기반의 이미지 생성모델 제시
    - (개발 내용) DCGAN은 CNN 구조로 판별자 D와 생성자 G를 구성하는 GAN임. 판별지는 이미지를 입력받아 이진분류를 수행하므로 CNN구조를, 생성자는 random vector z를 입력자로 받아 이미지를 생성해야하므로 deconvolutional network 구조를 갖는 방식으로 모델 개발 

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 스타일 변환 성능 Image Generation CycleGAN AMT Score 20 % 46.93 %
    2 이미지 생성 성능 Image Generation DCGAN IS 2 단위없음 2.21 단위없음

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 포맷

    1. 데이터 포맷
    구분  획득(수집) 단계  정제 단계 가공(라벨링) 단계
    데이터 구분 원시데이터 원시데이터 원천데이터
    데이터 형태 작품 → 동영상
    작품 → 이미지 파일
    동영상 → 불필요 영상 삭제 및 떨림 보정
    이미지 파일 → 스캔 과정에서의 노이즈 이미지 정제
    디지털 파일 형태로 산출
    데이터 포멧 * 영상 : MP4파일 / 해상도 (Full HD, 1920*1080)
    이미지 : JPG (300DPI 이상) 
    * 영상 : MP4파일
    / 해상도 (Full HD, 1920*1080)
    이미지 : JPG (300DPI 이상) 
    * 이미지: JPG
    메타데이터: JSON
    *영상 데이터는 라벨링 과정을 진행하지 않음
    영상 : MP4

     

     
    No 구분 필수여부 항목명 속성 및 내용
    1 원시데이터 필수  Dataset.identifier 데이터셋 식별자
    2 필수 Dataset.name 데이터셋 이름
    3 필수 Dataset.src_path 데이터셋 폴더 위치
    4 필수 Dataset.label_path 데이터셋 레이블
    폴더 위치
    5 필수 Dataset.category 데이터셋 대상 카테고리
    6 필수 Images.identifier 이미지 식별자(파일명)
    7 필수 Images.type 이미지(영상) 
    파일 확장자
    8 필수 Images.width 이미지 가로 크기(픽셀)
    9 필수 Images.height 이미지 세로 크기(픽셀) 
    10 필수 data.captured 이미지 생성 일자
    11 필수 Image.category 이미지 유형
    12 필수 Image.target 이미지 대상
    13 선택 camera_model 촬영 기기 모델명
    14 원천데이터 필수 annotations[].paint.method 수묵화 표현기법
    15 필수 annotations[].paint.size 작품 사이즈
    16 필수 annotations[].pair 원본 데이터 대상
    17 필수 annotations[].paper 종이 유형
    18 필수 annotations[].diff 작품 난이도


    2. 어노테이션 포맷

    2. 어노테이션 포맷
    구 분 항목명 타입 필수 설명
    1 dataset_info[]     라벨링 메타정보 공통참조항목
      1-1 identifier string y 데이터셋 식별자
    1-2 name string y 데이터셋 이름
    1-3 src_path string y 데이터셋 폴더 위치
    1-4 label_path string y 데이터셋 레이블 폴더위치
    1-5 category num y 데이터셋 대상 카테고리
    2 images[]     라벨링 이미지 파일 공통참조항목
      2-1 identifier string y 이미지 식별자
      2-2 type string y 이미지(영사) 파일 확장자
      2-3 width num y 이미지 가로 크기(픽셀)
      2-4 height num y 이미지 세로 크기(픽셀)
      2-5 captured string y 이미지 생성일자 및 시간
      2-6 category num y 이미지 유형 (구문규칙 참조)
      2-7 target num y 이미지 대상 (구문규칙 참조)
      2-8 camera_model string n 카메라 모델
    3 annotations[]     원천데이터(수묵화) 어노테이션 방식 ‘pair’ 데이터
      3-1 paint[] array y 원시데이터
      3-1-1 method num y 대화 주제
    3-1-2 Width num y 가로 사이즈
    3-1-3 Height num y 세로 사이즈
    3-2 Paire string y 원본데이터 대상
    3-3 PaperType num y 종이유형
    3-4 Difficulty num y 작품 난이도 

     


    3. 데이터 구성

    3. 데이터 구성
    No Field name Length Meaning
    1 대상별 구분 1 풍경 (1), 인물 (2), 사물 (3)
    2 유형별 구분 1 실사 사진 (1), 애니메이션 이미지 (2), 유명 서양화 (3)
    3 표현기법 구분 1 백묘법-건필 (1), 백묘법-중필 (2), 백묘법-습필(3) 
    구륵법-철선-운염 (4), 구륵법-철선-적묵(5), 구륵법-난엽-운염 (6), 구륵법-남염-적묵 (7)
    몰골법-발묵 (8), 몰골법-파묵 (9)
    4 종이 종류  1 화선지 (1), 순지 (2)
    5 등급별 구분 1 A (1), B (2), C (3), D (4)

     

    디렉터리 구조 Depth-1 Depth-2 Depth-3
    디렉토리 이름 원천데이터 01.풍경 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화
    02.인물 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화
    03.사물 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화
    라벨링데이터 01.풍경 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화
    02.인물 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화
    03.사물 01. 실사사진
    02. 애니메이션 이미지
    03. 유명 서양화

     

    분류 내용
    이미지 제복을 입고 피리를 불고 있는 소년 이미지 제복을 입고 피리를 불고 있는 소년 백묘법 버전 이미지
    원본데이터 원시데이터 –1 (인물-유명서양화-백묘법-중필-순지-B등급)
    제복을 입고 피리를 불고 있는 소년 몰골법 버전 이미지 제복을 입고 피리를 불고 있는 소년 구륵법 버전 이미지
    원시데이터 –2 원시데이터 –3
    (인물-유명서양화-몰골법-발묵-순지-B등급) (인물-유명서양화-구륵법-(철선-운염)-순지-B등급)
    라벨

    라벨링 데이터 스크린샷

    <그림> 라벨 예시

     

  • 데이터셋 구축 담당자

    수행기관(주관) : 경희대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    나형민 02-961-0641 [email protected] 데이터 수집, 데이터 검수
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    서울대학교 산학협력단 데이터 수집, 데이터 검수
    올빅뎃(주) 데이터 수집, 데이터 가공, 데이터 검수, AI모델 개발
    한국딥러닝(주) 데이터 수집, 데이터 가공, 데이터 검수, AI모델 개발
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    나형민 02-961-0641 [email protected]
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 [email protected] 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.