Document Intelligence 合約模型
重要
- 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- 文件智慧服務用戶端程式庫的公開預覽版預設為 REST API 版本 2024-07-31-preview。
- 公開預覽版 2024-07-31-preview 目前僅適用於下列 Azure 地區。 請注意,AI Studio 中的自訂生成 (文件欄位擷取) 模型僅適用美國中北部地區:
- 美國東部
- 美國西部 2
- 西歐
- 美國中北部
此內容適用於: v4.0 (預覽版) | 較舊版本: v3.1 (GA)
此內容適用於: v3.1 (GA) | 最新版本: v4.0 (預覽版)
Document Intelligence 合約模型會使用功能強大的光學字元辨識 (OCR) 功能,從選取的重要合約實體群組中分析和擷取索引鍵欄位和明細項目。 合約的格式與品質有各種類型,包括手機擷取的影像、掃描文件以及數位 PDF。 API 會分析文件文字;擷取索引鍵資訊,例如合作對象、法律機關、合約識別碼和標題;並傳回結構化 JSON 資料表示。 模型目前僅支援英文文件格式。
自動化合約處理
自動化合約處理是從文件中擷取重要合約欄位的流程。 從歷史上看,合約分析流程是手動完成的,因此非常耗時。 從合約中精確擷取索引鍵資料通常是合約自動化流程中的第一個且最重要的步驟之一。
開發選項
文件智慧服務 v4.0 (2024-07-31-preview) 支援以下工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
合約模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
預先建置合約 |
文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
合約模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
預先建置合約 |
文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
合約模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
預先建置合約 |
輸入需求
支援的檔案格式:
模型 PDF 影像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview) 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為
4
MB。影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為
1
GB。針對自訂分類模型定型,定型資料的大小總計為
1
GB (上限為 10,000 頁)。 對於 2024-07-31-preview 和更新版本,定型資料的大小總計為2
GB,最多 10,000 頁。
嘗試擷取合約文件資料
了解如何從合約擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:
一個 Azure 訂用帳戶 - 您可以建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
Document Intelligence Studio
在文件智慧服務工作室首頁上,選取 [稅務文件]。
您可以分析範例稅務文件,或上傳您自己的檔案。
選取 [執行分析] 按鈕,並視需要設定 [分析選項]:
支援的語言和地區設定
如需支援語言的完整清單, 請參閱 我們的 語言支援 — 預先建置的模型 頁面。
欄位擷取
如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的 合約模型架構 頁面。
擷取的合約機碼值組和明細項目位於 JSON 輸出的
documentResults
區段中。
下一步
使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。