다음을 통해 공유


문서 처리 사용자 지정 모델 만들기

요구 사항 검토 후 문서 처리 모델 작성을 시작할 수 있습니다.

마법사를 사용하여 모델 만들기

사용자 지정 모델 만들기 마법사를 사용하여 문서 처리 모델을 만들 수 있습니다. 마법사는 문서에서 정보를 추출하는 모델을 만드는 과정을 안내합니다.

  1. Power Apps 또는 Power Automate에 로그인합니다.

  2. 왼쪽 창에서 ... 더보기>AI 허브를 선택합니다.

    (선택 사항) AI 모델을 메뉴에 영구적으로 유지하여 쉽게 접근하려면 AI 허브 옆에 있는 고정 아이콘을 선택하세요.

  3. AI 기능 검색에서 AI 모델을 선택합니다.

  4. 문서에서 사용자 지정 정보 추출을 선택합니다.

  5. 사용자 지정 모델 만들기를 선택합니다.

  6. 단계별 마법사는 문서에서 추출하려는 모든 데이터를 나열하도록 요청하여 프로세스를 설명합니다.

    이 문서의 문서 유형 선택 섹션에서 자세히 알아보세요.

    사용자 고유의 문서를 사용하여 모델을 만들려면 동일한 레이아웃을 사용하는 다섯 가지 이상의 예제가 있는지 확인합니다. 그렇지 않은 경우에는 샘플 데이터를 사용하여 모델을 만들 수 있습니다.

  7. 학습을 선택합니다.

  8. 빠른 테스트를 선택하여 모델을 테스트합니다.

문서의 유형 선택

문서 유형 선택 단계에서 데이터 추출을 자동화하기 위해 AI 모델을 구축하려는 문서 유형을 선택합니다. 세 가지 옵션 고정 템플릿 문서, 일반 문서, 송장이 있습니다.

다양한 문서 유형의 스크린샷.

  • 고정 템플릿 문서: 이전에 구조화되었다고 했던 이 옵션은 지정된 레이아웃에 대해 필드, 테이블, 확인란, 서명 및 기타 항목을 유사한 위치에서 찾을 수 있는 경우에 적합합니다. 이 모델을 교육하여 레이아웃이 다른 구조화된 문서에서 데이터를 추출할 수 있습니다. 이 모델은 훈련 시간이 빠릅니다.
  • 일반 문서: 이전에는 구조화되지 않은 것으로 알려진 이 옵션은 모든 종류의 문서, 특히 설정된 구조가 없거나 형식이 복잡한 경우에 이상적입니다. 이 모델을 교육하여 레이아웃이 다른 구조화된 문서 또는 구조화되지 않은 문서에서 데이터를 추출할 수 있습니다. 이 모델은 강력하지만 훈련 시간이 오래 걸립니다.
  • 송장: 기본에 의한 필드 또는 적절하게 추출되지 않은 문서 샘플 외에 추출할 새 필드를 추가하여 사전 구축된 송장 처리 모델의 동작을 강화합니다.

문서 인텔리전스 버전 이해

문서 인텔리전스 모델은 v4.0 및 v3.1의 두 가지 버전으로 제공됩니다. 모델 버전은 모델을 마지막으로 편집한 시기에 따라 다릅니다.

Document Intelligence v4.0 - GA(일반 공급)

이 문서에 나열된 기능 외에도 v4.0은 v3.1의 모든 기능을 유지합니다.

  • 겹치는 필드: v4.0은 사용자 지정 모델에서 겹치는 필드를 지원하므로 복잡한 레이아웃이 있는 문서에서 정보를 보다 효과적으로 추출할 수 있습니다.
  • 서명 감지: v4.0은 문서에서 서명을 감지하며, 이는 계약서 및 기타 서명된 양식에 특히 유용합니다.
  • 테이블에 대한 신뢰도 점수: v4.0은 테이블 및 해당 셀에 대한 신뢰도 점수를 제공합니다.
  • OCR 엔진 개선 사항: v4.0은 OCR(광학 인식) 엔진을 개선하여 텍스트 인식 정확도를 높이고 더 많은 문서 유형 및 형식을 지원합니다.

Document Intelligence v3.1 GA(일반 공급)

  • v3.1은 고유한 텍스트 필드 또는 구조와 같은 특정 데이터 패턴을 인식하도록 학습된 사용자 지정 모델을 지원합니다.
  • v3.1에는 사용자가 문서 레이아웃 및 구조를 기반으로 템플릿을 만들 수 있는 사용자 지정 템플릿 모델이 포함되어 있습니다.

모델 버전 확인

모델을 학습하고 게시하는 데 사용되는 버전을 확인할 수 있습니다. 이렇게 하려면 설정>게시된 모델 버전>마지막으로 학습된 모델 버전을 선택합니다.

마지막으로 게시된 모델 버전 GA 및 마지막으로 학습된 모델 버전 GA를 가져오기 위한 '모델 설정' 패널의 스크린샷.

모델을 편집, 재학습 및 게시하여 v3.1에서 v4.0으로 이동할 수 있습니다. 태그 다시 지정 및 기타 특정 수정이 필요하지 않습니다. 문서 처리 관련 FAQ에서 자세히 알아보세요.

추출할 정보 정의

추출할 정보 선택 화면에서 모델이 추출하도록 학습시키려는 필드, 테이블 및 확인란을 정의합니다. 정의를 시작하려면 +추가를 선택합니다.

AI 모델이 추출할 필드, 테이블 및 확인란을 정의하는 문서 처리 마법사 단계의 스크린샷.

  1. 각 텍스트 필드에 대해 모델에서 사용할 필드의 이름을 제공합니다.

  2. 각 숫자 필드에 대해 모델에서 사용할 필드의 이름을 제공합니다.

    서식 점(.) 또는 쉼표(,)를 소수 구분 기호로 정의합니다.

  3. 날짜 필드에 대해 모델에서 사용할 필드의 이름을 제공합니다.

    또한 (, , ) 또는 (, , ) 또는 (, , ) 형식을 정의합니다

  4. 각 확인란에 대해 모델에서 사용할 확인란의 이름을 제공합니다.

    문서에서 확인할 수 있는 각 항목에 대해 별도의 확인란을 정의합니다.

  5. 각 테이블에 대해 테이블 이름을 제공합니다.

    모델이 추출해야 하는 다른 열을 정의합니다.

노트

사용자 지정 송장 모델에는 편집할 수 없는 기본 필드가 함께 제공됩니다.

컬렉션별로 문서 그룹화

컬렉션은 레이아웃이 같은 문서의 그룹입니다. 모델에서 처리할 문서 레이아웃만큼 컬렉션을 만듭니다. 예를 들어 각각 고유한 송장 템플릿이 있는 두 개의 서로 다른 공급 업체의 송장을 처리하는 AI 모델을 구축하는 경우 두 개의 컬렉션을 만듭니다.

컬렉션 생성 애니메이션.

생성하는 각 컬렉션에 대해 컬렉션당 최소 5개의 샘플 문서를 업로드해야 합니다. JPG, PNG 및 PDF 파일 형식의 파일이 허용됩니다.

문서 업로드 애니메이션.

참고

모델당 최대 200개의 컬렉션을 만들 수 있습니다.

다음 단계

문서 처리 모델의 문서에 태그 지정