共用方式為


Document Intelligence 合約模型

重要

  • 文件智慧服務公開預覽版本提供了對積極開發中之功能的早期存取權。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • 文件智慧服務用戶端程式庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:勾選記號 v4.0 (預覽版) | 較舊版本: blue-checkmark v3.1 (GA)

此內容適用於: 勾選記號 v3.1 (GA) | 最新版本: purple-checkmark v4.0 (預覽版)

Document Intelligence 合約模型會使用功能強大的光學字元辨識 (OCR) 功能,從選取的重要合約實體群組中分析和擷取索引鍵欄位和明細項目。 合約的格式與品質有各種類型,包括手機擷取的影像、掃描文件以及數位 PDF。 API 會分析文件文字;擷取索引鍵資訊,例如合作對象、法律機關、合約識別碼和標題;並傳回結構化 JSON 資料表示。 模型目前僅支援英文文件格式。

自動化合約處理

自動化合約處理是從文件中擷取重要合約欄位的流程。 從歷史上看,合約分析流程是手動完成的,因此非常耗時。 從合約中精確擷取索引鍵資料通常是合約自動化流程中的第一個且最重要的步驟之一。

開發選項

文件智慧服務 v4.0 (2024-02-29-preview) 支援以下工具、應用程式和程式庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
預先建置合約

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
預先建置合約

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
合約模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
預先建置合約

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX) 和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層用於分析文件的檔案大小為 500 MB,而免費 (F0) 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

嘗試擷取合約文件資料

了解如何從合約擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

Document Intelligence Studio

  1. 在 Document Intelligence Studio 首頁上,選取 [稅務文件]

  2. 您可以分析範例稅務文件,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    Document Intelligence Studio 中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

支援的語言和地區設定

如需支援語言的完整清單,請參閱我們的語言支援—預先建置模型頁面。

欄位擷取

以下是從 JSON 輸出回應中合約擷取的欄位。

名稱 類型​​ 描述 範例輸出
標題 String 合約標題 服務合約
ContractId String 合約標題 AB12956
合作對象 Array 法律合作對象清單
ExecutionDate Date 合約已完全簽署並經所有合作對象同意的日期 On this twenty-third day of February two thousand and twenty two
ExpirationDate Date 合約結束生效的日期 一年
RenewalDate Date 合約需要續約的日期 On this twenty-third day of February two thousand and twenty two
司法管轄區 Array 司法管轄區清單

擷取的合約機碼值組和明細項目位於 JSON 輸出的 documentResults 區段中。

下一步