什麼是 Azure AI 文件智慧服務?
重要
- 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- 文件智慧服務用戶端程式庫的公開預覽版預設為 REST API 版本 2024-07-31-preview。
- 公開預覽版 2024-07-31-preview 目前僅適用於下列 Azure 地區。 請注意,AI Studio 中的自訂生成 (文件欄位擷取) 模型僅適用美國中北部地區:
- 美國東部
- 美國西部 2
- 西歐
- 美國中北部
此內容適用於: v3.1 (GA) | 最新版本: v4.0 (預覽版) | 舊版: v3.0 v2.1
此內容適用於: v3.0 (GA) | 最新版本: v4.0 (預覽版) v3.1 | 舊版: v2.1
此內容適用於: v2.1 | 最新版本: v4.0 (預覽版)
注意
Azure 表格辨識器現在是 Azure AI 文件智慧服務!
- 自 2023 年 7 月起,Azure AI 服務包含先前稱為認知服務和 Azure 應用 AI 服務的所有項目。
- 價格沒有變更。
- 認知服務和 Azure 應用 AI 的名稱會繼續用於 Azure 計費、成本分析、價目表和價格 API。
- 在 (和包含) v3.1 之前,應用程式開發介面 (API) 或 SDK 沒有任何重大變更。 從 v4.0 開始,API 和 SDK 會更新至文件智慧服務。
- 某些平台仍在等候重新命名更新。 我們文件中的 Azure 表格辨識器或文件智慧服務全都是指相同的 Azure 服務。
Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓您建置智慧型文件處理解決方案。 跨越各種資料類型的大量資料會儲存在表單和文件中。 文件智慧服務可讓您有效地管理資料收集及處理的速度,並且對於改善作業、明智的資料導向決策,以及啟發式創新至關重要。
| ✔️ 文件分析模型 | ✔️ 預建模型 | ✔️ 自訂模型 |
一般擷取模型
一般擷取模型可啟用從表單和文件擷取文字,並針對貴組織的動作、使用或發展傳回結構化商務就緒內容。
預建模型
預建模型可讓您將智慧型文件處理新增至應用程式和流程,而不需要定型及建置您自己的模型。
財經服務和法律
銀行帳單 |從銀行帳單中擷取帳戶資訊和詳細資料。
支票 |從支票擷取相關資訊。
合約 | 擷取合約和當事人詳細資料。
信用卡 | 擷取支付卡資訊。
發票 | 擷取客戶和廠商詳細資料。
薪資單 |擷取薪資單詳細資料。
收據 | 擷取銷售交易詳細資料。
美國稅務
統一美國稅務 |從支援的任何美國稅務表格中擷取。
美國稅務 W-2 | 擷取應納稅補償詳細資料。
美國稅務 1098 |擷取 1098
變化型詳細資料。
美國稅務 1099 |擷取 1099
變化型詳細資料。
美國稅務 1040 |擷取 1040
變化型詳細資料。
美國抵押貸款
美國抵押貸款 1003 | 擷取貸款申請詳細資料。
美國抵押貸款 1004 | 從評鑑擷取資訊。
美國抵押貸款 1005 | 從雇用驗擷取資訊。
美國抵押貸款 1008 | 擷取貸款傳送詳細資料。
美國抵押貸款公開揭示 | 擷取最終結案貸款條款。
個人識別碼
🆕 健康保險卡 | 擷取保險範圍詳細資料。
身分識別 | 擷取驗證詳細資料。
婚姻證書 | 擷取有證書的婚姻資訊。
發票 | 擷取客戶
和廠商詳細資料。
收據 | 擷取銷售
交易詳細資料。
身分識別 | 擷取識別
和驗證詳細資料。
🆕 健康保險卡 | 擷取健康保險詳細資料。
名片 | 擷取業務連絡人詳細資料。
合約 | 擷取合約
和合作物件詳細資料。
美國稅務 W-2 | 擷取應納稅
補償詳細資料。
美國稅務 1098 |擷取 1098
變化型詳細資料。
自訂模型
自訂模型是使用標示的資料集來定型,以從表單和文件中擷取不同的資料,專屬於您的使用案例。 您可以結合獨立自訂模型來建立組成模型。
文件欄位擷取模型
✔️ 文件欄位擷取模型會定型,以從文件中擷取已標記的欄位。
自訂生成式 |針對具有非結構化格式和不同範本的檔案,使用生成式 AI 建置自定義擷取模型。
自訂神經 | 從混合類型文件擷取資料。
自訂範本 | 從靜態配置擷取資料。
自訂撰寫 | 使用模型集合來擷取資料。
自訂分類模型
✔️自訂分類器在叫用擷取模型之前,會先識別文件類型。
自訂分類器 | 在叫用擷取模型之前,先識別指定的文件類型 (類別)。
附加元件功能
文件智慧服務支援視文件擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能可用於 2023-07-31 (GA)
、和更新版本:
2024-07-31-preview
版本引進適用於可搜尋 PDF輸出的 read
模型支援:
文件智慧服務支援視文件擷取案例而定,可啟用和停用的選用功能。 下列附加元件功能可用於 2023-10-31-preview
和更新版本:
分析功能
Model ID | 內容擷取 | 查詢欄位 | 段落 | 段落角色 | 選取標記 | 資料表 | 索引鍵/值組 | 語言 | 條碼 | 文件分析 | 公式* | 樣式字型* | 高解析度* | 可搜尋 PDF |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | O | O | O | O | O | |||||||||
prebuilt-layout | O | O | O | O | O | |||||||||
prebuilt-document | O | O | O | O | O | |||||||||
prebuilt-businessCard | ||||||||||||||
預先建置合約 | O | O | O | O | ||||||||||
prebuilt-healthInsuranceCard.us | O | O | O | O | O | |||||||||
prebuilt-idDocument | O | O | O | O | O | |||||||||
prebuilt-invoice | O | O | O | O | O | O | ||||||||
prebuilt-receipt | O | O | O | O | O | |||||||||
prebuilt-marriageCertificate.us | O | O | O | O | O | |||||||||
prebuilt-creditCard | O | O | O | O | O | |||||||||
prebuilt-check.us | O | O | O | O | O | |||||||||
prebuilt-payStub.us | O | O | O | O | O | |||||||||
prebuilt-bankStatement | O | O | O | O | O | |||||||||
prebuilt-mortgage.us.1003 | O | O | O | O | O | |||||||||
prebuilt-mortgage.us.1004 | O | O | O | O | O | |||||||||
prebuilt-mortgage.us.1005 | O | O | O | O | O | |||||||||
prebuilt-mortgage.us.1008 | O | O | O | O | O | |||||||||
prebuilt-mortgage.us.closingDisclosure | O | O | O | O | O | |||||||||
prebuilt-tax.us | O | O | O | O | O | |||||||||
prebuilt-tax.us.w2 | O | O | O | O | O | |||||||||
prebuilt-tax.us.1098 | O | O | O | O | O | |||||||||
prebuilt-tax.us.1098E | O | O | O | O | O | |||||||||
prebuilt-tax.us.1098T | O | O | O | O | O | |||||||||
prebuilt-tax.us.1099(variations) | O | O | O | O | O | |||||||||
prebuilt-tax.us.1040(variations) | O | O | O | O | O | |||||||||
{ customModelName } | O | O | O | O | O |
✓ - 啟用
O - 選用
* - 進階功能會產生額外費用
模型和開發選項
注意
文件智慧服務 v3.0 支援下列文件瞭解模型和開發選項。
您可以使用文件智慧服務將應用程式和工作流程中的文件處理自動化、增強資料驅動策略,並擴充文件搜尋功能。 使用下表中的連結來深入了解每個模型,以及瀏覽開發選項。
參閱
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-read | ● 從文件中擷取文字。 ● 資料擷取 |
• 將任何文件數位化。 • 合規性和稽核。 • 翻譯前處理手寫筆記。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
版面配置
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-layout | • 從文件擷取文字和版面配置資訊。 • 資料擷取 |
• 依結構編製文件索引和擷取文件。 • 財務和醫療報告分析。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
一般文件 (在 2023-10-31-preview 中已淘汰)
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-document | ● 從文件中擷取文字、版面配置和機碼值組。 ● 資料和欄位擷取 |
● 機碼值組擷取。 ● 表單處理。 ● 問卷資料收集和分析。 |
● Document Intelligence Studio ● REST API |
發票
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-invoice | ● 從發票中擷取金鑰資訊。 ● 資料和欄位擷取 |
● 應付帳款處理。 ● 自動化稅務記錄和報告。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
收據
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-receipt | ● 從收據擷取金鑰資訊。 ● 資料和欄位擷取 ● 收據模型 v3.0 支援處理單頁旅館收據。 |
● 費用管理。 ● 取用者行為資料分析。 ● 客戶忠誠度計畫。 ● 商品退回處理。 ● 自動化稅務記錄和報告。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
身分識別 (ID)
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-idDocument | ● 從護照和身分證擷取金鑰資訊。 ● 文件類型 ● 從美國駕照擷取簽署、限制和車輛分類。 |
● 了解您的客戶 (KYC) 金融服務指導方針合規性。 ● 醫療帳戶管理。 ● 身分識別檢查點和閘道。 ● 旅館註冊。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
勾選
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-check | ● 從支票擷取重要資訊。 ● 資料和欄位擷取 |
• 信用管理。 • 自動化貸款人管理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
薪資單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-paystub | ● 從薪資單擷取重要資訊。 ● 資料和欄位擷取 |
• 員工薪資詳細資料驗證。 • 雇用詐騙偵測。 • 自動化稅務處理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
銀行對帳單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-bankStatement | ● 從銀行對帳單擷取重要資訊。 ● 資料和欄位擷取 |
• 稅務處理使用案例。 • 自動化會計管理。 • 借貸管理。 • 貸款文件處理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
健保卡
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● 從美國健保卡擷取金鑰資訊。 ● 資料和欄位擷取 |
● 涵蓋範圍和資格驗證。 ● 預測模型化。 ● 以值為基礎的分析。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
合約模型
Model ID | 描述 | 開發選項 |
---|---|---|
預先建置合約 | 擷取合約協議和當事人詳細資料。 • 資料和欄位擷取 |
● 文件智慧服務工作室 ● REST API ● REST API ● C# SDK ● Python SDK ● JAVA SDK ● JavaScript SDK |
信用卡模型
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-creditCard | 擷取合約和合作物件詳細資料。 • 資料和欄位擷取 |
● 文件智慧服務工作室 ● REST API ● REST API ● C# SDK ● Python SDK ● JAVA SDK ● JavaScript SDK |
婚姻證書模型
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-marriageCertificate.us | 擷取合約和合作物件詳細資料。 • 資料和欄位擷取 |
● 文件智慧服務工作室 ● REST API ● REST API ● C# SDK ● Python SDK ● JAVA SDK ● JavaScript |
美國抵押貸款 1003 表單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-mortgage.us.1003 | • 從 1003 貸款申請中擷取重要資訊。 • 資料和欄位擷取 |
• 梅芬妮和馬菲迪的文件需求。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國抵押貸款 1004 表單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-mortgage.us.1004 | • 從 1004 評估擷取重要資訊。 • 資料和欄位擷取 |
• 梅芬妮和馬菲迪的文件需求。 • 統一住宅評估報告,用於協助貸款人/客戶了解標的財產之市場價值。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國抵押貸款 1005 表單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-mortgage.us.1005 | ● 從雇用驗證 1005 擷取重要資訊。 • 資料和欄位擷取 |
• 梅芬妮和馬菲迪的文件需求。 ● 雇用文件驗證,用於判斷是否有資格成為潛在貸款人。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國抵押貸款 1008 表單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● 您想要從統一核貸和傳送摘要中擷取重要資訊。 • 資料和欄位擷取 |
• 使用摘要資料進行核貸處理。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國抵押貸款公開揭示表單
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● 您想要從統一核貸和傳送摘要中擷取重要資訊。 • 資料和欄位擷取 |
• 抵押貸款最終詳細資料需求。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國稅賦 W-2 模型
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-tax.us.W-2 | ● 從 IRS US W2 稅務表單 (2018-2021 年) 擷取金鑰資訊。 ● 資料和欄位擷取 |
● 自動化稅務文件管理。 ● 抵押借貸申請處理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國稅務 1098 (及變化型) 表單
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-tax.us.1098{variation } |
● 從 1098 表單變化型擷取重要資訊。 ● 資料和欄位擷取 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國稅務 1099 (及變化型) 表單
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-tax.us.1099{variation } |
● 從 1099 表單變化型擷取資訊。 ● 資料和欄位擷取 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
美國稅務 1040 (及變化型) 表單
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-tax.us.1040{variation } |
● 從 1040 表單變化型擷取資訊。 ● 資料和欄位擷取 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
統一美國稅務表格
Model ID | 描述 | 開發選項 |
---|---|---|
prebuilt-tax.us | ● 從任何支援的美國稅務表格擷取資訊。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
名片
Model ID | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
prebuilt-businessCard | ● 從名片中擷取金鑰資訊。 ● 資料和欄位擷取 |
● 潛在客戶和行銷管理。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
自訂模型概觀
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
自訂模型 | 根據從一組代表性定型文件集建立的模型,從表單和文件將資訊擷取到結構化資料。 | 從您企業和使用案例專屬的表單和文件擷取不同資料。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
自訂生成式 (文件欄位擷取)
注意
自訂生成式模型僅適用於 Azure AI Studio。 若要在 AI Studio 中試用自訂生成式模型,請造訪文件欄位擷取 (自訂生成式)
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
自訂生成式模型 | 自訂生成式模型可從具有各種視覺範本的非結構化文件或結構化表單中擷取欄位。 | 此模型會使用生成式 AI 擷取欄位,只要一些已標記樣本即可改善品質,且可整合至具有基礎和信賴分數的流程。 | Azure AI Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
自訂神經
注意
若要將自訂神經模型定型,請將 buildMode
屬性設定為 neural
。
如需詳細資訊,請參閱 定型神經模型
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
自訂神經模型 | 自訂神經模型可用來擷取結構化 (調查、問卷)、半結構化 (發票、採購單),以及非結構化文件 (合約、信件)。 | 從結構化和非結構化文件擷取文字資料、核取方塊和表格式欄位。 | Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
自訂範本
注意
若要將自訂範本模型定型,請將 buildMode
屬性設定為 template
。
如需詳細資訊,請參閱 定型範本模型。
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
自訂範本模型 | 自訂範本模型會從結構化和半結構化文件中擷取標記的值和欄位。 |
從具有已定義視覺範本或常見視覺配置、表單的高度結構化文件中擷取金鑰資料。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript SDK |
自訂組成
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
組成自訂模型 | 組成模型的建立方式是取得自訂模型的集合,並將其指派給您表單類型建置的單一模型。 | 當您要定型數個模型,並想要將其分組以分析類似的表單類型 (如採購單) 時,這很實用。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
自訂分類模型
關於 | 描述 | 自動化使用案例 | 開發選項 |
---|---|---|---|
組成分類模型 | 自訂分類模型結合版面配置和語言功能,可偵測、識別及分類輸入檔內的文件。 | ● 包含申請表單、工資單和銀行對帳單的貸款申請套件。 ● 掃描的發票集合。 |
● Document Intelligence Studio ● REST API |
Azure AI 文件智慧服務是雲端式 Azure AI 服務,可讓開發人員建置智慧型文件處理解決方案。 文件智慧服務會套用機器學習式的光學字元辨識 (OCR) 和文件了解技術,以便從文件擷取文字、資料表、結構以及機碼值組。 您也可以標記和定型自訂模型,以自動從結構化、半結構化及非結構化文件中擷取資料。 若要深入了解每個模型,請參閱概念文章:
模型類型 | 模型名稱 |
---|---|
文件分析模型 | ● 版面配置分析模型 |
預建模型 | ● 發票模型 ● 收據模型 ● 身分識別文件 (ID) 模型 ● 名片模型 |
自訂模型 | ● 自訂模型 ● 撰寫模型 |
此內容適用於: v2.1 | 最新版本: v4.0 (預覽版)
文件智慧服務模型和開發選項
提示
- 如需增強體驗和進階模型品質,請嘗試文件智慧服務 v3.0 工作室。
- v3.0 工作室支援使用 v2.1 標記資料定型的任何模型。
- 如需從 v2.1 移轉到 v3.0 的詳細資訊,您可以參閱《API 移轉指南》。
注意
文件智慧服務 v2.1 支援下列模型和開發選項。
使用下表中的連結來深入了解每個模型,以及瀏覽 API 參考:
模型 | 描述 | 開發選項 |
---|---|---|
版面配置分析 | 從表格和文件擷取和分析文字、選取項目標記、表格和週框方塊座標。 | ● Document Intelligence 標籤工具 ● REST API ● Client-library SDK ● Document Intelligence Docker 容器 |
自訂模型 | 從獨特的商務資料和使用案例專屬的表格和文件擷取和分析資料。 | ● Document Intelligence 標籤工具 ● REST API ● 範例標籤工具 ● Document Intelligence Docker 容器 |
發票模型 | 從銷售發票進行自動化資料處理並擷取重要資訊。 | ● Document Intelligence 標籤工具 ● REST API ● Client-library SDK ● Document Intelligence Docker 容器 |
收據模型 | 從銷售收據進行自動化資料處理並擷取重要資訊。 | ● Document Intelligence 標籤工具 ● REST API ● Client-library SDK ● Document Intelligence Docker 容器 |
身分識別文件 (ID) 模型 | 從美國駕照與國際護照進行自動化資料處理並擷取重要資訊。 | ● Document Intelligence 標籤工具 ● REST API ● Client-library SDK ● Document Intelligence Docker 容器 |
名片模型 | 從名片進行自動化資料處理並擷取重要資訊。 | ● Document Intelligence 標籤工具 ● REST API ● Client-library SDK ● Document Intelligence Docker 容器 |
資料隱私權和安全性
和所有 AI 服務一樣,使用文件智慧服務的開發人員應該要了解 Microsoft 對於客戶資料的政策。 請參閱我們的 Document Intelligence 的資料、隱私權和安全性頁面。
下一步
使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
使用文件智慧服務範例標記工具嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。