我應該選擇哪一個模型?

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)

此內容適用於:複選標記v3.1 (GA) | 最新版本:紫色複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.0

此內容適用於:複選標記v3.0 (GA) | 最新版本:紫色複選標記v4.0 (預覽)紫色複選標記v3.1

Azure AI 檔案智慧支援各種不同的模型,可讓您將智慧型手機檔案處理新增至您的應用程式,並將工作流程優化。 選取正確的模型是確保企業成功的關鍵。 在本文中,我們會探索可用的文件智慧模型,並提供如何為您的專案選擇最佳解決方案的指引。

下列決策圖表醒目提示每個 Document Intelligence v3.0 支援模型的功能,並協助您選擇最佳的模型,以符合應用程式的需求和需求。

重要

請務必檢查 語言支援 頁面,以取得支援的語言文字和功能字段擷取。

預先定型的檔分析模型

Document type 範例 要擷取的資料 您最好的解決方案
一般檔 合約或信件。 您想要主要擷取已寫入或列印的文字行、單字、位置和偵測到的語言。 讀取 OCR 模型
包含結構信息的檔。 報告或研究。 除了寫入或列印的文字,您還需要擷取結構資訊,例如表格、選取標記、段落、標題和子標題。 版面配置分析模型
結構化或半結構化檔,其中包含格式化為欄位(索引鍵)和值的內容。 表單或檔,是您企業或產業中常用的標準化格式,例如信用申請或問卷。 您想要擷取欄位和值,包括案例特定預先建置模型 未涵蓋的欄位和值,而不需要定型自定義模型 **啟用選擇性查詢字串參數 features=keyValuePairs 的版面配置分析模型 **

預先定型的案例特定模型

Document type 要擷取的資料 您最好的解決方案
美國 W-2 稅單 您想要擷取工資、工資和稅金等重要資訊。 美國稅務 W-2 模型
美國稅金 1098 窗體 您想要擷取抵押貸款利息詳細數據,例如本金、點數和稅務。 美國稅金 1098 模型
美國稅務 1098-E 表單 您想要擷取學生貸款利息詳細數據,例如貸款人和利息金額。 美國稅金 1098-E 模型
美國稅務 1098T 窗體 您想要擷取合格的學費詳細數據,例如獎學金調整、學生身份和貸款人資訊。 美國稅金 1098-T 模型
美國稅金 1099(變化) 表單 您想要從 1099 表單及其變化中擷取資訊(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)。 美國稅金 1099 模型
美國稅金 1040(變化) 表單 您想要從 1040 表單及其變化中擷取資訊(排程 1、排程 2、排程 3、排程 8812、排程 A、排程 B、排程 C、排程 D、排程 E、排程 EIC、排程 F、排程 H、排程 J、排程 R、排程 SE、排程資深)。 美國稅金 1040 模型
合同 (雙方的法律協定)。 您想要擷取合約合約詳細數據,例如合作物件、日期和間隔。 合約模型
健康保險卡 或健康保險標識碼。 您想要擷取主要資訊,例如保險公司、成員標識碼、處方保險和組號。 健康保險卡模型
信用卡/轉帳卡 您想要擷取金鑰資訊銀行卡,例如卡號和銀行名稱。 信用卡/轉帳卡模型
結婚證 您想要從結婚證中擷取金鑰資訊。 結婚證模式
發票 或帳單。 您想要擷取金鑰資訊,例如客戶名稱、帳單位址和到期金額。 發票模型
收據、代金券或單頁旅館收據。 您想要擷取主要資訊,例如商家名稱、交易日期和交易總計。 收據模型
身分識別檔(標識符), 例如美國駕駛執照或國際護照。 您想要擷取密鑰資訊,例如名字、姓氏、出生日期、位址和簽章。 身分識別檔 (標識符) 模型
美國抵押貸款1003 . 您想要從統一住宅貸款申請中擷取重要資訊。 1003 窗體模型
美國抵押貸款1008 年。 您想要從統一承銷和傳輸摘要中擷取重要資訊。 1008 窗體模型
美國抵押貸款收盤披露 您想要從抵押貸款關閉披露窗體中擷取重要資訊。 抵押貸款收盤披露窗體模型
混合類型檔與 結構化、半結構化和/或非結構化專案。 您想要擷取索引鍵/值組、選取標記、數據表、簽章字段,以及預先建置或一般檔模型未擷取的選取區域。 自訂模型

提示

  • 如果您仍然不確定要使用哪一個預先定型的模型,請嘗試啟用選擇性查詢字串參數features=keyValuePairs的配置模型
  • 版面配置模型是由讀取 OCR 引擎所提供,可偵測頁面、數據表、樣式、文字、線條、單字、位置和語言。

自訂擷取模型

訓練集合 範例檔 您最好的解決方案
結構化且一致且具有靜態版面配置的檔。 結構化表單,例如問卷或應用程式。 自定義範本模型
結構化、半結構化和非結構化檔 • 結構化→調查
• 半結構化→發票
• 非結構化→信件
自定義神經模型
數個模型集合,每個模型都會在類似類型檔上定型。 • 供應採購單
• 設備採購單
• 傢俱採購單
全部組成單一模型
撰寫的自定義模型

自訂分類模型

訓練集合 範例檔 您最好的解決方案
至少兩種不同類型的檔 表單、信件或檔 自訂分類模型

下一步