檔智慧自定義模型

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

此內容適用於:複選標記v3.1 (GA) | 最新版本:紫色複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.0blue-checkmarkv2.1

此內容適用於:複選標記v3.0 (GA) | 最新版本:紫色複選標記v4.0 (預覽)紫色複選標記v3.1 | 舊版:blue-checkmarkv2.1

此內容適用於:複選標記v2.1 | 最新版本:blue-checkmarkv4.0(預覽)

檔智慧使用進階機器學習技術來識別檔、偵測及擷取表單和文件的資訊,並在結構化 JSON 輸出中傳回擷取的數據。 透過文件智慧,您可以使用檔分析模型、預先建置/預先定型,或已定型的獨立自定義模型。

自定義模型現在包含 自定義分類模型 ,適用於您需要在叫用擷取模型之前識別檔類型的案例。 分類器模型可從 API 開始 2023-07-31 (GA) 使用。 分類模型可以與自定義擷取模型配對,以分析及擷取您企業專屬的表單和檔中的欄位,以建立文件處理解決方案。 獨立自定義擷取模型可以結合以建立 組成模型

自訂檔案模型類型

自定義檔模型可以是兩種類型之一: 自定義範本 或自定義表單,以及 自定義神經 或自定義檔模型。 這兩個模型的標籤和定型程式都相同,但模型會有所不同,如下所示:

自訂擷取模型

若要建立自訂擷取模型,您可以使用所要擷取的值來標記文件的資料集,並針對加上標籤的資料集定型模型。 您只需要五個相同表單或檔案類型的範例即可開始使用。

自定義神經模型

重要

從 4.0 版 — 2024-02-29-preview API 開始,自定義類神經模型現在支援 重疊的欄位數據表、數據列和單元格層級信賴度

自定義神經(自定義檔)模型會使用深度學習模型和以大量檔集合定型的基底模型。 當您使用加上標籤的數據集來定型模型時,此模型會經過微調或調整為您的數據。 自定義神經模型支持結構化、半結構化和非結構化檔,以擷取字段。 自定義神經模型目前支援英文檔。 當您在兩個模型類型之間選擇時,請從類神經模型開始,以判斷它是否符合您的功能需求。 若要深入瞭解自定義檔模型,請參閱 類神經模型

自定義範本模型

自定義範本或自定義表單模型依賴一致的視覺範本來擷取已標記的數據。 檔視覺結構中的變異數會影響模型的正確性。 問卷或應用程式等結構化表單是一致的視覺範例。

您的定型集是由結構化檔所組成,其中格式設定和版面配置是靜態的,也是從一個文件實例到下一個文件實例的常數。 自定義範本模型支援機碼/值組、選取標記、數據表、簽章欄位和區域。 以任何 支援的語言,在檔案上定型範本模型和 。 如需詳細資訊, 請參閱自定義範本模型

如果您的檔和擷取案例的語言支援自定義類神經網路模型,建議您透過範本模型使用自定義神經模型,以取得更高的精確度。

提示

若要確認您的定型文件呈現一致的視覺範本,請從集合中的每個表單中移除所有使用者輸入的數據。 如果空白窗體的外觀相同,它們代表一致的視覺範本。

如需詳細資訊, 請參閱解譯和改善自定義模型的精確度和信賴度。

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 圖片:
    jpeg/jpg、png、bmp、tiff、heif
    Microsoft Office:
    Word(docx)、Excel(xlsx)、PowerPoint(pptx)
    參閱
    版面配置 ✔ (2024-02-29-preview、 2023-10-31-preview 及更新版本)
    一般文件
    預建
    自訂擷取
    自訂分類

    ✱ Microsoft Office 檔案目前不支援其他模型或版本。

  • 針對 PDF 和 TIFF,最多可以處理 2,000 個頁面(使用免費層訂用帳戶,只會處理前兩個頁面)。

  • 用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度對應至每英吋 150 個點的大約 8點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

  • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

  • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

建置模式

建置自定義模型作業會新增範本類神經自定義模型的支援。 舊版的 REST API 和用戶端連結庫僅支援目前稱為 範本 模式的單一建置模式。

  • 範本模型只接受具有相同基本頁面結構的檔,也就是統一的視覺外觀,或檔內元素的相同相對位置。

  • 類神經模型支援具有相同資訊但不同頁面結構的檔。 這些檔的範例包括 美國 W2 窗體,這些窗體會共用相同的資訊,但在公司外觀上有所不同。 神經模型目前僅支援英文文字。

下表提供 GitHub 上建置模式程式設計語言 SDK 參考和程式代碼範例的連結:

程式設計語言 SDK 參考 程式碼範例
C#/.NET DocumentBuildMode 結構 Sample_BuildCustomModelAsync.cs
Java DocumentBuildMode 類別 BuildModel.java
JavaScript DocumentBuildMode 類型 buildModel.js
Python DocumentBuildMode 列舉 sample_build_model.py

比較模型功能

下表比較自定義範本和自定義神經功能:

功能 自訂樣本 (表單) 自訂神經(檔案)
文件結構 範本、表單和結構化 結構化、半結構化和非結構化
定型時間 1 到 5 分鐘 20 分鐘到1小時
資料擷取 索引鍵/值組、數據表、選取標記、座標和簽章 索引鍵/值組、選取標記和數據表
重疊欄位 不支援 支援
檔變化 每個變化都需要模型 針對所有變化使用單一模型
語言支援 多種語言 支援 英文,具有西班牙文、法文、德文、義大利文和荷蘭 文支援的預覽支援

自訂分類模型

檔分類是使用 (v3.1 GA) API 的檔智慧 2023-07-31 所支援的新案例。 檔分類器 API 支援分類和分割案例。 定型分類模型,以識別應用程式支援的不同文件類型。 分類模型的輸入檔案可以包含多個文件,並將每個文件分類在相關聯的頁面範圍內。 若要深入瞭解, 請參閱自定義分類 模型。

注意

2024-02-29-preview API 版本檔分類開始,現在支援 Office 檔案類型進行分類。 此 API 版本也引進 分類模型的累加式定 型。

自訂模型工具

檔案智慧 v3.1 和更新版本模型支援下列工具、應用程式和連結庫、程式和連結庫:

功能 資源 Model ID
自訂模型 文件智慧 Studio
REST API
C# SDK• Python SDK
custom-model-id

Document Intelligence v2.1 支援下列工具、應用程式和連結庫:

注意

使用 Document Intelligence 3.1 版和 v3.0 API 提供自定義模型類型 自定義神經自定義範本

功能 資源
自訂模型 檔案智慧標籤工具
REST API
用戶端連結庫 SDK
檔案智慧 Docker 容器

建置自定義模型

使用自定義模型從您的特定或唯一檔擷取數據。 您需要下列資源:

  • Azure 訂用帳戶。 您可以 免費建立一個。

  • Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (F0) 來試用服務。 部署資源之後,選取 [移至資源 ] 以取得您的金鑰和端點。

    顯示 Azure 入口網站 中金鑰和端點位置的螢幕快照。

範例標籤工具

提示

  • 如需增強體驗和進階模型品質,請嘗試文件智慧服務 v3.0 工作室
  • v3.0 Studio 支援使用 v2.1 標籤數據定型的任何模型。
  • 如需從 v2.1 移轉至 v3.0 的詳細資訊,請參閱 API 移轉指南。
  • 請參閱我們的 REST API C#、Java、JavaScriptPython SDK 快速入門,以開始使用 v3.0 版本。
  • 檔智慧範例標籤工具是 開放原始碼 工具,可讓您測試檔智慧和光學字元辨識 (OCR) 功能的最新功能。

  • 請嘗試範例卷標工具快速入門,開始建置和使用自定義模型。

Document Intelligence Studio

注意

Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。

  1. 在 Document Intelligence Studio 首頁上,選取 [自定義擷取模型]。

  2. 在 [我的專案] 底下,選取 [建立專案]。

  3. 完成專案詳細數據欄位。

  4. 藉由新增 儲存體 帳戶和 Blob 容器來設定服務資源,以 連線 定型數據來源。

  5. 檢閱並建立您的專案。

  6. 將範例檔新增至標籤、建置及測試您的自定義模型。

如需建立第一個自定義擷取模型的詳細逐步解說, 請參閱如何建立自定義擷取模型

自定義模型擷取摘要

下表比較支持的數據擷取區域:

模型 表單欄位 選取標記 結構化欄位 (資料表) 簽章 區域標籤 重疊欄位
自訂範本 不適用
自訂神經 不適用 * ✔ (2024-02-29-preview)

資料表符號
✔ —支援
**n/a— 目前無法使用;
*-根據模型的行為不同。 使用範本模型時,綜合數據會在定型時產生。 使用類神經模型時,會選取區域中辨識的結束文字。

提示

在兩個模型類型之間選擇時,如果它符合您的功能需求,請從自定義神經模型開始。 若要深入瞭解自定義神經模型,請參閱 自定義神經

自訂模型開發選項

下表描述與相關聯工具和客戶端連結庫搭配使用的功能。 最佳做法是,請確定您使用此處所列的相容工具。

Document type REST API SDK 標籤和測試模型
自定義範本 v 4.0 v3.1 v3.0 文件智慧 3.1 文件智慧 SDK Document Intelligence Studio
自定義類神經 v4.0 v3.1 v3.0 文件智慧 3.1 文件智慧 SDK Document Intelligence Studio
自定義表單 v2.1 檔智慧 2.1 GA API 文件智慧 SDK 範例標籤工具

注意

使用 3.0 API 定型的自定義範本模型,在 2.1 API 上會有一些改善,這源於 OCR 引擎的改進。 使用 2.1 API 來定型自定義範本模型的數據集仍可使用 3.0 API 來定型新模型。

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式為 JPEG/JPG、PNG、BMP、TIFF 和 PDF(文字內嵌或掃描)。 建議使用文字內嵌的 PDF,以消除擷取字元和位置時可能發生的錯誤。

  • 針對 PDF 和 TIFF 檔案,最多可以處理 2,000 頁。 使用免費層訂用帳戶時,只會處理前兩個頁面。

  • 付費 (S0) 層的檔案大小必須小於 500 MB,免費 (F0) 層必須小於 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • PDF 維度最大到 17 x 17 英吋,對應於標準 (美國 8.5 x 14) 或 A3 紙張尺寸或更小。

  • 定型數據的總大小為500頁或更少。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

    提示

    定型資料:

    • 可以的話,請使用文字型 PDF 文件,而不是影像型文件。 掃描的 PDF 將視為影像處理。
    • 請只為每個檔提供表單一實例。
    • 針對填入表單,請使用已填入所有欄位的範例。
    • 使用在每個欄位中具有不同值的表單。
    • 如果您的表單影像品質較低,請使用較大的數據集。 例如,使用10到15個影像。

支援的語言和地區設定

如需支援語言的完整清單,請參閱 我們的 語言支援 - 自定義模型 頁面。

下一步