什麼是 Azure AI 文件智慧服務?

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

此內容適用於:複選標記v3.1 (GA) | 最新版本:紫色複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.0blue-checkmarkv2.1

此內容適用於:複選標記v3.0 (GA) | 最新版本:紫色複選標記v4.0 (預覽)紫色複選標記v3.1 | 舊版:blue-checkmarkv2.1

此內容適用於:複選標記v2.1 | 最新版本:blue-checkmarkv4.0(預覽)

注意

Azure 表格辨識器現在是 Azure AI 文件智慧服務

  • 自 2023 年 7 月起,Azure AI 服務包含先前稱為認知服務和 Azure 應用 AI 服務的所有項目。
  • 價格沒有變更。
  • 認知服務Azure 應用 AI 的名稱會繼續用於 Azure 計費、成本分析、價目表和價格 API。
  • 在和包含 v3.1 之前,應用程式開發介面(API)或 SDK 沒有任何重大變更。 從 v4.0 開始,API 和 SDK 會更新為文件智慧。
  • 某些平台仍在等候重新命名更新。 我們文件中的 Azure 表格辨識器或文件智慧服務全都是指相同的 Azure 服務。

Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓您建置智慧型文件處理解決方案。 跨越各種資料類型的大量資料會儲存在表單和文件中。 文件智慧服務可讓您有效地管理資料收集及處理的速度,並且對於改善作業、明智的資料導向決策,以及啟發式創新至關重要。

| ✔️ 文件分析模型 | ✔️ 預建模型 | ✔️ 自訂模型 |

文件分析模型

檔分析模型可讓您從表單和檔擷取文字,並傳回已準備好可供組織動作、使用或開發之結構化商務就緒內容。


讀取 | 擷取印刷
和手寫文字。


版面配置 |擷取文字、
數據表和文件結構。


讀取 | 擷取印刷
和手寫文字。


版面配置 |擷取文字、
數據表和文件結構。


一般文件 | 擷取文字、
結構和機碼值組。

預建模型

預建模型可讓您將智慧型文件處理新增至應用程式和流程,而不需要定型及建置您自己的模型。


發票 |擷取客戶和廠商詳細數據。


收據 |擷取銷售交易詳細數據。


身分識別 |擷取驗證詳細數據。


美國抵押貸款 1003 |擷取貸款申請詳細數據。


美國抵押貸款 1008 |擷取貸款傳輸詳細數據。


美國抵押貸款披露 |擷取最終結案貸款條款。


健康保險卡 |擷取保險涵蓋範圍詳細數據。


合約 |擷取合約和合作對象詳細數據。


信用卡/轉帳卡 |擷取付款卡資訊。


結婚證 |擷取經認證的婚姻資訊。


美國稅務 W-2 窗體 |擷取應稅補償詳細數據。


美國稅金 1098 表單 | 擷取貸款利息詳細資料。


美國稅金 1098-E 表單 |擷取學生貸款利息詳細數據。


美國稅金 1098-T 表單 | 擷取合格的訂用帳戶詳細資料。


美國稅務 1099 窗體 |擷取表單 1099 變化詳細數據。


美國稅務 1040 窗體 |擷取表單 1040 變化詳細數據。


發票 | 擷取客戶
和廠商詳細資料。


收據 | 擷取銷售
交易詳細資料。


身分識別 | 擷取識別
和驗證詳細資料。


健康保險卡 |擷取健康保險詳細數據。


名片 | 擷取業務連絡人詳細資料。


合約 | 擷取合約
和合作物件詳細資料。


美國稅務 W-2 窗體 |擷取應
稅補償詳細數據。


美國稅金 1098 表單 | 擷取貸款利息詳細資料。


美國稅金 1098-E 表單 |擷取學生貸款利息詳細數據。


美國稅金 1098-T 表單 | 擷取合格的訂用帳戶詳細資料。

自訂模型

  • 自訂模型是使用標示的資料集來定型,以從表單和文件中擷取不同的資料,專屬於您的使用案例。
  • 您可以結合獨立自訂模型來建立組成模型。
  • 擷取模型 自定義擷取模型
    ✔️會定型,以從檔擷取已標記的欄位。


自訂範本 | 從靜態配置擷取資料。


自訂神經 | 從混合類型文件擷取資料。


自訂撰寫 | 使用模型集合來擷取資料。

  • 分類模型
    ✔️ 自定義分類器在叫用擷取模型之前先識別檔類型。


自定義分類器 |在叫用擷取模型之前,先識別指定的檔類型(類別
)。

附加元件功能

檔智慧支持視檔擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能適用於 2023-07-31 (GA) 和更新版本:

檔智慧支持視檔擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能適用於2024-02-29-preview2023-10-31-preview和更新版本:

分析功能

模型識別碼 內容擷 查詢欄位 段落 段落角色 選取標記 資料表 索引鍵/值組 語言 條碼 檔分析 公式* 樣式字型* 高解析度*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
預先建置合約 O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(變化) O O O O O
prebuilt-tax.us.1040(變化) O O O O O
{ customModelName } O O O O O

✓ - 已啟用
O - 選擇性
* - 進階版 功能會產生額外費用

模型和開發選項

注意

文件智慧服務 v3.0 支援下列文件瞭解模型和開發選項。

您可以使用文件智慧服務將應用程式和工作流程中的文件處理自動化、增強資料驅動策略,並擴充文件搜尋功能。 使用下表中的連結來深入了解每個模型,以及瀏覽開發選項。

參閱

使用 Document Intelligence Studio 讀取模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-read • 從文件擷取 文字
數據擷取
• 將任何文件數位化。
• 合規性和稽核。
• 翻譯前處理手寫筆記。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

版面配置

使用 Document Intelligence Studio 進行版面配置模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-layout • 從檔擷取 文字和版面配置 資訊。
數據擷取
• 依結構編製索引和擷取檔。
• 財務和醫療報告分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般檔 (在 2023-10-31-preview 中已被取代)

使用 Document Intelligence Studio 進行一般檔模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-document ● 從文件中擷取文字、版面配置和機碼值組
資料和欄位擷取
● 機碼值組擷取。
● 表單處理。
● 問卷資料收集和分析。
Document Intelligence Studio
REST API

發票

使用 Document Intelligence Studio 發票模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-invoice ● 從發票中擷取金鑰資訊。
資料和欄位擷取
● 應付帳款處理。
● 自動化稅務記錄和報告。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

收據

使用 Document Intelligence Studio 發票模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-receipt ● 從收據擷取金鑰資訊。
資料和欄位擷取
● 收據模型 v3.0 支援處理單頁旅館收據
● 費用管理。
● 取用者行為資料分析。
● 客戶忠誠度計畫。
● 商品退回處理。
● 自動化稅務記錄和報告。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

身分識別 (ID)

使用 Document Intelligence Studio 進行身分識別 (ID) 檔模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-idDocument ● 從護照和身分證擷取金鑰資訊。
文件類型
● 從美國駕照擷取簽署、限制和車輛分類。
● 了解您的客戶 (KYC) 金融服務指導方針合規性。
● 醫療帳戶管理。
● 身分識別檢查點和閘道。
● 旅館註冊。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國抵押貸款 1003 窗體

使用 Document Intelligence Studio 進行美國抵押貸款 1003 檔模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-mortgage.us.1003 • 從 1003 貸款申請中擷取重要資訊。
數據和欄位擷取
• Fannie Mae 和 Freddie Mac 檔需求。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國抵押貸款 1008 窗體

使用 Document Intelligence Studio 進行美國抵押貸款 1008 檔模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-mortgage.us.1008 • 從統一承銷和傳輸摘要擷取重要資訊。
數據和欄位擷取
• 使用摘要數據進行貸款承銷處理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國抵押貸款披露窗體

使用 Document Intelligence Studio 進行美國抵押貸款關閉披露檔模型分析的螢幕快照。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-mortgage.us.closingDisclosure • 從統一承銷和傳輸摘要擷取重要資訊。
數據和欄位擷取
• 抵押貸款最終詳細數據要求。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

健保卡

使用 Document Intelligence Studio 健保卡模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-healthInsuranceCard.us ● 從美國健保卡擷取金鑰資訊。
資料和欄位擷取
● 涵蓋範圍和資格驗證。
● 預測模型化。
● 以值為基礎的分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

合約模型

使用 Document Intelligence Studio 合約模型擷取的螢幕擷取畫面。

模型識別碼 描述 開發選項
預先建置合約 擷取合約合約和合作對象詳細數據。
數據和欄位擷取
Document Intelligence Studio
REST API• REST API

C# SDK
Python SDK• Java SDK
JavaSCRIPT

信用卡模型

使用 Document Intelligence Studio 進行信用卡影像模型分析的螢幕快照。

模型識別碼 描述 開發選項
prebuilt-creditCard 擷取合約和合作物件詳細資料。
數據和欄位擷取
Document Intelligence Studio
REST API• REST API

C# SDK
Python SDK• Java SDK
JavaSCRIPT

結婚證模式

使用 Document Intelligence Studio 的婚姻憑證檔模型分析螢幕快照。

模型識別碼 描述 開發選項
prebuilt-marriageCertificate.us 擷取合約和合作物件詳細資料。
數據和欄位擷取
Document Intelligence Studio
REST API• REST API

C# SDK
Python SDK• Java SDK
JavaSCRIPT

美國稅務 W-2 模型

使用 Document Intelligence Studio W-2 模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-tax.us.W-2 ● 從 IRS US W2 稅務表單 (2018-2021 年) 擷取金鑰資訊。
資料和欄位擷取
● 自動化稅務文件管理。
● 抵押借貸申請處理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國稅務 1098 表單

Document Intelligence Studio 中分析的美國 1098 稅務表單螢幕擷取畫面。

模型識別碼 描述 開發選項
prebuilt-tax.us.1098 擷取貸款利率資訊和詳細資料。
數據和欄位擷取
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國稅務 1098-E 表單

Document Intelligence Studio 中分析的美國 1098-E 稅務表單螢幕擷取畫面。

模型識別碼 描述 開發選項
prebuilt-tax.us.1098E 擷取學生貸款資訊和詳細資料。
數據和欄位擷取
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國稅務 1098-T 表單

Document Intelligence Studio 中分析的美國 1098-T 稅務表單螢幕擷取畫面。

模型識別碼 描述 開發選項
prebuilt-tax.us.1098T 擷取學費資訊和詳細資料。
數據和欄位擷取
Document Intelligence Studio
REST API

美國稅金 1099 (和變化) 表單

Document Intelligence Studio 中分析美國 1099 稅務窗體的螢幕快照。

模型識別碼 描述 開發選項
prebuilt-tax.us.1099{variation} 從 1099 格式變化擷取資訊。
數據和欄位擷取
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美國稅金 1040 窗體

使用 Document Intelligence Studio 進行美國稅務 1040 稅務表單模型分析的螢幕快照。

模型識別碼 描述 開發選項
prebuilt-tax.us.1040 從 1040 格式變化擷取資訊。
數據和欄位擷取
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

名片

使用 Document Intelligence Studio 名片模型分析的螢幕擷取畫面。

模型識別碼 描述 自動化使用案例 開發選項
prebuilt-businessCard ● 從名片中擷取金鑰資訊。
資料和欄位擷取
● 潛在客戶和行銷管理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

自訂模型概觀

使用 Document Intelligence Studio 自訂模型定型的螢幕擷取畫面。

關於 描述 自動化使用案例 開發選項
自訂模型 根據從一組代表性定型文件集建立的模型,從表單和文件將資訊擷取到結構化資料。 從您企業和使用案例專屬的表單和文件擷取不同資料。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂範本

使用 Document Intelligence Studio 自訂範本模型分析的螢幕擷取畫面。

注意

若要將自訂範本模型定型,請將 buildMode 屬性設定為 template。 如需詳細資訊,請參閱定型範本模型

關於 描述 自動化使用案例 開發選項
自訂範本模型 自訂範本模型會從結構化和半結構化文件中擷取標記的值和欄位。
從具有已定義視覺範本或常見視覺配置、表單的高度結構化文件中擷取金鑰資料。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

自訂神經

使用 Document Intelligence Studio 自訂神經模型分析的螢幕擷取畫面。

注意

若要將自訂神經模型定型,請將 buildMode 屬性設定為 neural。 如需詳細資訊,請參閱定型神經模型

關於 描述 自動化使用案例 開發選項
自訂神經模型 自訂神經模型可用來擷取結構化 (調查、問卷)、半結構化 (發票、採購單),以及非結構化文件 (合約、信件)。 從結構化和非結構化文件擷取文字資料、核取方塊和表格式欄位。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂組成

在 Document Intelligence Studio 中組成自訂模型清單的螢幕擷取畫面。

關於 描述 自動化使用案例 開發選項
組成自訂模型 組成模型的建立方式是取得自訂模型的集合,並將其指派給您表單類型建置的單一模型。 當您定型數個模型,並想要將其分組以分析類似採購單等表單型類型時很有用。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自訂分類模型

Document Intelligence Studio 中自定義分類模型標籤的螢幕快照。

關於 描述 自動化使用案例 開發選項
組成分類模型 自訂分類模型結合版面配置和語言功能,可偵測、識別及分類輸入檔內的文件。 ● 包含申請表單、工資單和銀行對帳單的貸款申請套件。
● 掃描的發票集合。
Document Intelligence Studio
REST API

Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓開發人員建置智慧型文件處理解決方案。 文件智慧服務會套用機器學習式的光學字元辨識 (OCR) 和文件了解技術,以便從文件擷取文字、資料表、結構以及機碼值組。 您也可以標記和定型自訂模型,以自動從結構化、半結構化及非結構化文件中擷取資料。 若要深入了解每個模型,請參閱概念文章:

模型類型 模型名稱
文件分析模型 版面配置分析模型
預建模型 發票模型
收據模型
身分識別文件 (ID) 模型
名片模型
自訂模型 自訂模型
撰寫模型

此內容適用於:複選標記v2.1 | 最新版本:blue-checkmarkv4.0(預覽)

文件智慧服務模型和開發選項

提示

  • 如需增強體驗和進階模型品質,請嘗試文件智慧服務 v3.0 工作室
  • v3.0 工作室支援使用 v2.1 標記資料定型的任何模型。
  • 如需從 v2.1 移轉到 v3.0 的詳細資訊,您可以參閱《API 移轉指南》。

注意

文件智慧服務 v2.1 支援下列模型和開發選項。

使用下表中的連結來深入了解每個模型,以及瀏覽 API 參考:

模型 描述 開發選項
版面配置分析 從表格和文件擷取和分析文字、選取項目標記、表格和週框方塊座標。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
自訂模型 從獨特的商務資料和使用案例專屬的表格和文件擷取和分析資料。 Document Intelligence 標籤工具
REST API
範例標籤工具
Document Intelligence Docker 容器
發票模型 從銷售發票進行自動化資料處理並擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
收據模型 從銷售收據進行自動化資料處理並擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
身分識別文件 (ID) 模型 從美國駕照與國際護照進行自動化資料處理並擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器
名片模型 從名片進行自動化資料處理並擷取重要資訊。 Document Intelligence 標籤工具
REST API
Client-library SDK
Document Intelligence Docker 容器

資料隱私權和安全性

和所有 AI 服務一樣,使用文件智慧服務的開發人員應該要了解 Microsoft 對於客戶資料的政策。 請參閱我們的 Document Intelligence 的資料、隱私權和安全性頁面。

下一步