什麼是 Azure AI 文件智慧服務?

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2023-10-31-preview
  • 公開預覽版本 2023-10-31-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:checkmarkv4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

此內容適用於:checkmarkv3.1 (GA) | 最新版本:purple-checkmarkv4.0 (預覽) | 舊版:blue-checkmarkv3.0blue-checkmarkv2.1

此內容適用於:v3.0 (GA) | 最新版本:purple-checkmarkcheckmarkv4.0 (預覽)purple-checkmarkv3.1 (預覽) | 舊版:blue-checkmarkv2.1

此內容適用於:checkmarkv2.1 | 最新版本:blue-checkmarkv4.0(預覽)

注意

Azure 表格辨識器現在是 Azure AI 文件智慧服務

  • 自 2023 年 7 月起,Azure AI 服務包含先前稱為認知服務和 Azure 應用 AI 服務的所有項目。
  • 價格沒有變更。
  • 認知服務Azure 應用 AI 的名稱會繼續用於 Azure 計費、成本分析、價目表和價格 API。
  • 在和包含 v3.1 之前,應用程式開發介面(API)或 SDK 沒有任何重大變更。 從 v4.0 開始,API 和 SDK 會更新為文件智慧。
  • 某些平台仍在等候重新命名更新。 我們文件中的 Azure 表格辨識器或文件智慧服務全都是指相同的 Azure 服務。

Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓您建置智慧型文件處理解決方案。 跨越各種資料類型的大量資料會儲存在表單和文件中。 文件智慧服務可讓您有效地管理資料收集及處理的速度,並且對於改善作業、明智的資料導向決策,以及啟發式創新至關重要。

| ✔️ 文件分析模型 | ✔️ 預建模型 | ✔️ 自訂模型 |

文件分析模型

文件分析模型可啟用從表單和文件擷取文字,並針對貴組織的動作、使用或進度傳回結構化商務就緒內容。


讀取 | 擷取印刷
和手寫文字。


版面配置 |擷取文字、
數據表和文件結構。


讀取 | 擷取印刷
和手寫文字。


版面配置 |擷取文字、
數據表和文件結構。


一般文件 | 擷取文字、
結構和機碼值組。

預建模型

預建模型可讓您將智慧型文件處理新增至應用程式和流程,而不需要定型及建置您自己的模型。


發票 | 擷取客戶
和廠商詳細資料。


收據 | 擷取銷售
交易詳細資料。


身分識別 | 擷取識別
和驗證詳細資料。


健康保險卡 |擷取健康保險
詳細數據。


合約 | 擷取合約
和合作物件詳細資料。


美國稅務 W-2 窗體 |擷取應
稅補償詳細數據。


美國稅金 1098 表單 | 擷取貸款利息詳細資料。


美國稅金 1098-E 表單 |擷取學生貸款利息詳細數據。


美國稅金 1098-T 表單 | 擷取合格的訂用帳戶詳細資料。


美國稅務 1099 窗體 |從 1099 窗體的變化擷取資訊。


發票 | 擷取客戶
和廠商詳細資料。


收據 | 擷取銷售
交易詳細資料。


身分識別 | 擷取識別
和驗證詳細資料。


健康保險卡 |擷取健康保險詳細數據。


名片 | 擷取業務連絡人詳細資料。


合約 | 擷取合約
和合作物件詳細資料。


美國稅務 W-2 窗體 |擷取應
稅補償詳細數據。


美國稅金 1098 表單 | 擷取貸款利息詳細資料。


美國稅金 1098-E 表單 |擷取學生貸款利息詳細數據。


美國稅金 1098-T 表單 | 擷取合格的訂用帳戶詳細資料。

自訂模型

  • 自訂模型是使用標示的資料集來定型,以從表單和文件中擷取不同的資料,專屬於您的使用案例。
  • 獨立自定義模型可以結合以建立組成模型。
  • 擷取模型 自定義擷取模型
    ✔️會定型,以從檔擷取已標記的欄位。


自訂範本 | 從靜態配置擷取資料。


自訂神經 | 從混合類型文件擷取資料。


自訂撰寫 | 使用模型集合來擷取資料。

  • 分類模型
    ✔️ 自定義分類器在叫用擷取模型之前先識別檔類型。


自定義分類器 |在叫用擷取模型之前,先識別指定的檔類型(類別
)。

附加元件功能

檔智慧支持視檔擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能適用於 2023-07-31 (GA) 和更新版本:

檔智慧支持視檔擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能適用於 2023-10-31-preview 和更新版本:

分析功能

Model ID 內容擷 段落 段落角色 選取標記 資料表 索引鍵/值組 語言 條碼 檔分析 公式* 樣式字型* 高解析度* 查詢欄位
prebuilt-read O O O O O
prebuilt-layout O O O O O O
prebuilt-idDocument O O O O O
預建發票 O O O O O O
prebuilt-receipt O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(變化) O O O O O
預先建置合約 O O O O O
{ customModelName } O O O O O
prebuilt-document (
淘汰 2023-10-31-preview
O O O O O
prebuilt-businessCard (
淘汰 2023-10-31-preview

✓ - 已啟用
O - 選擇性
* - 進階版 功能會產生額外費用。

模型和開發選項

注意

文件智慧服務 v3.0 支援下列文件瞭解模型和開發選項。

您可以使用文件智慧服務將應用程式和工作流程中的文件處理自動化、增強資料驅動策略,並擴充文件搜尋功能。 使用下表中的連結來深入了解每個模型,以及瀏覽開發選項。

參閱

Screenshot of Read model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-read • 從文件擷取 文字
數據擷取
• 將任何文件數位化。
• 合規性和稽核。
• 翻譯前處理手寫筆記。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

版面配置

Screenshot of the layout model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-layout • 從檔擷取 文字和版面配置 資訊。
數據擷取
• 依結構編製索引和擷取檔。
• 財務和醫療報告分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般檔 (在 2023-10-31-preview 中已被取代)

Screenshot of General Document model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-document ● 從文件中擷取文字、版面配置和機碼值組
資料和欄位擷取
● 機碼值組擷取。
● 表單處理。
● 問卷資料收集和分析。
Document Intelligence Studio
REST API

發票

Screenshot of Invoice model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
預建發票 ● 從發票中擷取金鑰資訊。
資料和欄位擷取
● 應付帳款處理。
● 自動化稅務記錄和報告。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

收據

Screenshot of Receipt model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-receipt ● 從收據擷取金鑰資訊。
資料和欄位擷取
● 收據模型 v3.0 支援處理單頁旅館收據
● 費用管理。
● 取用者行為資料分析。
● 客戶忠誠度計畫。
● 商品退回處理。
● 自動化稅務記錄和報告。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

身分識別 (ID)

Screenshot of Identity (ID) Document model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-idDocument ● 從護照和身分證擷取金鑰資訊。
文件類型
● 從美國駕照擷取簽署、限制和車輛分類。
● 了解您的客戶 (KYC) 金融服務指導方針合規性。
● 醫療帳戶管理。
● 身分識別檢查點和閘道。
● 旅館註冊。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

健保卡

Screenshot of Health insurance card model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-healthInsuranceCard.us ● 從美國健保卡擷取金鑰資訊。
資料和欄位擷取
● 涵蓋範圍和資格驗證。
● 預測模型化。
● 以值為基礎的分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

合約模型

Screenshot of Contract model extraction using Document Intelligence Studio.

Model ID 描述 開發選項
預先建置合約 擷取合約和合作物件詳細資料。 Document Intelligence Studio
REST API

美國稅務 W-2 模型

Screenshot of W-2 model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-tax.us.W-2 ● 從 IRS US W2 稅務表單 (2018-2021 年) 擷取金鑰資訊。
資料和欄位擷取
● 自動化稅務文件管理。
● 抵押借貸申請處理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國稅務 1098 表單

Screenshot of US 1098 tax form analyzed in the Document Intelligence Studio.

Model ID 描述 開發選項
prebuilt-tax.us.1098 擷取貸款利率資訊和詳細資料。 Document Intelligence Studio
REST API

美國稅務 1098-E 表單

Screenshot of US 1098-E tax form analyzed in the Document Intelligence Studio.

Model ID 描述 開發選項
prebuilt-tax.us.1098E 擷取學生貸款資訊和詳細資料。 Document Intelligence Studio
REST API

美國稅務 1098-T 表單

Screenshot of US 1098-T tax form analyzed in the Document Intelligence Studio.

Model ID 描述 開發選項
prebuilt-tax.us.1098T 擷取學費資訊和詳細資料。 Document Intelligence Studio
REST API

美國稅金 1099 (和變化) 表單

Screenshot of US 1099 tax form analyzed in the Document Intelligence Studio.

Model ID 描述 開發選項
prebuilt-tax.us.1099(變化) 從 1099 格式變化擷取資訊。 Document Intelligence Studio
REST API

名片

Screenshot of Business card model analysis using Document Intelligence Studio.

Model ID 描述 自動化使用案例 開發選項
prebuilt-businessCard ● 從名片中擷取金鑰資訊。
資料和欄位擷取
● 潛在客戶和行銷管理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

自訂模型概觀

Screenshot of Custom model training using Document Intelligence Studio.

關於 描述 自動化使用案例 開發選項
自訂模型 根據從一組代表性定型文件集建立的模型,從表單和文件將資訊擷取到結構化資料。 從您企業和使用案例專屬的表單和文件擷取不同資料。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂範本

Screenshot of Custom Template model analysis using Document Intelligence Studio.

注意

若要將自訂範本模型定型,請將 buildMode 屬性設定為 template。 如需詳細資訊,請參閱定型範本模型

關於 描述 自動化使用案例 開發選項
自訂範本模型 自訂範本模型會從結構化和半結構化文件中擷取標記的值和欄位。
從具有已定義視覺範本或常見視覺配置、表單的高度結構化文件中擷取金鑰資料。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

自訂神經

Screenshot of Custom Neural model analysis using Document Intelligence Studio.

注意

若要將自訂神經模型定型,請將 buildMode 屬性設定為 neural。 如需詳細資訊,請參閱定型神經模型

關於 描述 自動化使用案例 開發選項
自訂神經模型 自訂神經模型可用來擷取結構化 (調查、問卷)、半結構化 (發票、採購單),以及非結構化文件 (合約、信件)。 從結構化和非結構化文件擷取文字資料、核取方塊和表格式欄位。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂組成

Screenshot of Composed Custom model list in Document Intelligence Studio.

關於 描述 自動化使用案例 開發選項
組成自訂模型 撰寫的模型是藉由取得自定義模型的集合,並將其指派給從窗體類型建置的單一模型來建立。 當您定型數個模型,並想要將其分組以分析類似採購單等表單型類型時很有用。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂分類模型

{alt-text}

關於 描述 自動化使用案例 開發選項
組成分類模型 自訂分類模型結合版面配置和語言功能,可偵測、識別及分類輸入檔內的文件。 ● 包含申請表單、工資單和銀行對帳單的貸款申請套件。
● 掃描的發票集合。
Document Intelligence Studio
REST API

Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓開發人員建置智慧型文件處理解決方案。 文件智慧服務會套用機器學習式的光學字元辨識 (OCR) 和文件了解技術,以便從文件擷取文字、資料表、結構以及機碼值組。 您也可以為自定義模型加上標籤和定型,以自動從結構化、半結構化和非結構化檔擷取數據。 若要深入瞭解每個模型, 請參閱 概念文章:

模型類型 模型名稱
檔分析模型 版面配置分析模型
預建模型 發票模型• 收據模型

身分識別檔(標識符)模型
名片模型
自訂模型 自定義模型
撰寫模型

此內容適用於:checkmarkv2.1 | 最新版本:blue-checkmarkv4.0(預覽)

文件智慧服務模型和開發選項

提示

  • 如需增強體驗和進階模型品質,請嘗試文件智慧服務 v3.0 工作室
  • v3.0 Studio 支援使用 v2.1 標籤數據定型的任何模型。
  • 如需從 v2.1 移轉至 v3.0 的詳細資訊,請參閱 API 移轉指南。

注意

文件智慧服務 v2.1 支援下列模型和開發選項。

使用資料表中的連結來深入瞭解每個模型,並流覽 API 參考:

模型 描述 開發選項
版面配置分析 從表單和檔擷取和分析文字、選取標記、表格和周框方塊座標。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
自訂模型 擷取和分析不同商務數據和使用案例特有的表單和檔。 Document Intelligence 標籤工具
REST API
範例標籤工具
Document Intelligence Docker 容器
發票模型 從銷售發票自動數據處理和擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
收據模型 從銷售收據自動數據處理和擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
身分識別檔 (標識符) 模型 從美國駕駛執照和國際護照自動數據處理和擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
名片模型 從名片自動數據處理和擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器

資料隱私權和安全性

和所有 AI 服務一樣,使用文件智慧服務的開發人員應該要了解 Microsoft 對於客戶資料的政策。 請參閱我們的 Document Intelligence 的資料、隱私權和安全性頁面。

下一步