共用方式為


Document Intelligence 合約模型

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)

此內容適用於:複選標記v3.1 (GA) | 最新版本:紫色複選標記v4.0 (預覽)

Document Intelligence 合約模型會使用功能強大的光學字元辨識 (OCR) 功能,從選取的重要合約實體群組中分析和擷取索引鍵欄位和明細項目。 合約的格式與品質有各種類型,包括手機擷取的影像、掃描文件以及數位 PDF。 API 會分析文件文字;擷取索引鍵資訊,例如合作對象、法律機關、合約識別碼和標題;並傳回結構化 JSON 資料表示。 此模型目前支援英文檔案格式。

自動化合約處理

自動化合約處理是從文件中擷取重要合約欄位的流程。 從歷史上看,合約分析程式是手動完成的,因此非常耗時。 從合約中精確擷取索引鍵資料通常是合約自動化流程中的第一個且最重要的步驟之一。

開發選項

Document Intelligence v4.0 (2024-02-29-preview) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
預先建置合約

Document Intelligence v3.1 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
預先建置合約

Document Intelligence v3.0 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
預先建置合約

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 圖片:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview, 2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

嘗試擷取合約文件資料

了解如何從合約擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:

  • Azure 訂用帳戶-您可以 免費建立一個訂用帳戶。

  • Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (F0) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。

Azure 入口網站 中金鑰和端點位置的螢幕快照。

Document Intelligence Studio

  1. 在 [Document Intelligence Studio] 首頁上,選取 [ 稅務檔]。

  2. 您可以分析範例稅務檔,或上傳您自己的檔案。

  3. 選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項

    Document Intelligence Studio 中 [執行分析和分析選項] 按鈕的螢幕快照。

支援的語言和地區設定

如需支援語言的完整清單,請參閱 我們的 語言支援 — 預先建置的模型 頁面。

欄位擷取

以下是從 JSON 輸出回應中合約擷取的欄位。

名稱 類型​​ 描述 範例輸出
標題 String 合約標題 服務合約
ContractId String 合約標題 AB12956
各方 陣列 法律合作對象清單
ExecutionDate Date 合約已完全簽署並經所有合作對象同意的日期 On this twenty-third day of February two thousand and twenty two
ExpirationDate Date 合約結束生效的日期 一年
RenewalDate Date 合約需要續約的日期 On this twenty-third day of February two thousand and twenty two
司法管轄區 陣列 司法管轄區清單

擷取的合約機碼值組和明細項目位於 JSON 輸出的 documentResults 區段中。

下一步