我應該選擇哪一個模型?
重要
- Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
- 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview。
- 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
- 美國東部
- 美國西部 2
- 西歐
此內容適用於:v4.0 (預覽) | 舊版:v3.1 (GA)v3.0 (GA)
此內容適用於:v3.1 (GA) | 最新版本:v4.0 (預覽) | 舊版:v3.0
此內容適用於:v3.0 (GA) | 最新版本:v4.0 (預覽)v3.1
Azure AI 檔案智慧支援各種不同的模型,可讓您將智慧型手機檔案處理新增至您的應用程式,並將工作流程優化。 選取正確的模型是確保企業成功的關鍵。 在本文中,我們會探索可用的文件智慧模型,並提供如何為您的專案選擇最佳解決方案的指引。
下列決策圖表醒目提示每個 Document Intelligence v3.0 支援模型的功能,並協助您選擇最佳的模型,以符合應用程式的需求和需求。
重要
請務必檢查 語言支援 頁面,以取得支援的語言文字和功能字段擷取。
預先定型的檔分析模型
Document type | 範例 | 要擷取的資料 | 您最好的解決方案 |
---|---|---|---|
一般檔。 | 合約或信件。 | 您想要主要擷取已寫入或列印的文字行、單字、位置和偵測到的語言。 | 讀取 OCR 模型 |
包含結構信息的檔。 | 報告或研究。 | 除了寫入或列印的文字,您還需要擷取結構資訊,例如表格、選取標記、段落、標題和子標題。 | 版面配置分析模型 |
結構化或半結構化檔,其中包含格式化為欄位(索引鍵)和值的內容。 | 表單或檔,是您企業或產業中常用的標準化格式,例如信用申請或問卷。 | 您想要擷取欄位和值,包括案例特定預先建置模型 未涵蓋的欄位和值,而不需要定型自定義模型。 | **啟用選擇性查詢字串參數 features=keyValuePairs 的版面配置分析模型 ** |
預先定型的案例特定模型
Document type | 要擷取的資料 | 您最好的解決方案 |
---|---|---|
美國 W-2 稅單 | 您想要擷取工資、工資和稅金等重要資訊。 | 美國稅務 W-2 模型 |
美國稅金 1098 窗體 | 您想要擷取抵押貸款利息詳細數據,例如本金、點數和稅務。 | 美國稅金 1098 模型 |
美國稅務 1098-E 表單 | 您想要擷取學生貸款利息詳細數據,例如貸款人和利息金額。 | 美國稅金 1098-E 模型 |
美國稅務 1098T 窗體 | 您想要擷取合格的學費詳細數據,例如獎學金調整、學生身份和貸款人資訊。 | 美國稅金 1098-T 模型 |
美國稅金 1099(變化) 表單 | 您想要從 1099 表單及其變化中擷取資訊(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)。 |
美國稅金 1099 模型 |
美國稅金 1040(變化) 表單 | 您想要從 1040 表單及其變化中擷取資訊(排程 1、排程 2、排程 3、排程 8812、排程 A、排程 B、排程 C、排程 D、排程 E、排程 EIC、排程 F、排程 H、排程 J、排程 R、排程 SE、排程資深)。 |
美國稅金 1040 模型 |
合同 (雙方的法律協定)。 | 您想要擷取合約合約詳細數據,例如合作物件、日期和間隔。 | 合約模型 |
健康保險卡 或健康保險標識碼。 | 您想要擷取主要資訊,例如保險公司、成員標識碼、處方保險和組號。 | 健康保險卡模型 |
信用卡/轉帳卡 。 | 您想要擷取金鑰資訊銀行卡,例如卡號和銀行名稱。 | 信用卡/轉帳卡模型 |
結婚證 。 | 您想要從結婚證中擷取金鑰資訊。 | 結婚證模式 |
發票 或帳單。 | 您想要擷取金鑰資訊,例如客戶名稱、帳單位址和到期金額。 | 發票模型 |
收據、代金券或單頁旅館收據。 | 您想要擷取主要資訊,例如商家名稱、交易日期和交易總計。 | 收據模型 |
身分識別檔(標識符), 例如美國駕駛執照或國際護照。 | 您想要擷取密鑰資訊,例如名字、姓氏、出生日期、位址和簽章。 | 身分識別檔 (標識符) 模型 |
美國抵押貸款1003 . | 您想要從統一住宅貸款申請中擷取重要資訊。 | 1003 窗體模型 |
美國抵押貸款1008 年。 | 您想要從統一承銷和傳輸摘要中擷取重要資訊。 | 1008 窗體模型 |
美國抵押貸款收盤披露 。 | 您想要從抵押貸款關閉披露窗體中擷取重要資訊。 | 抵押貸款收盤披露窗體模型 |
混合類型檔與 結構化、半結構化和/或非結構化專案。 | 您想要擷取索引鍵/值組、選取標記、數據表、簽章字段,以及預先建置或一般檔模型未擷取的選取區域。 | 自訂模型 |
提示
- 如果您仍然不確定要使用哪一個預先定型的模型,請嘗試啟用選擇性查詢字串參數
features=keyValuePairs
的配置模型。 - 版面配置模型是由讀取 OCR 引擎所提供,可偵測頁面、數據表、樣式、文字、線條、單字、位置和語言。
自訂擷取模型
訓練集合 | 範例檔 | 您最好的解決方案 |
---|---|---|
結構化且一致且具有靜態版面配置的檔。 | 結構化表單,例如問卷或應用程式。 | 自定義範本模型 |
結構化、半結構化和非結構化檔。 | • 結構化→調查 • 半結構化→發票 • 非結構化→信件 |
自定義神經模型 |
數個模型集合,每個模型都會在類似類型檔上定型。 | • 供應採購單 • 設備採購單 • 傢俱採購單 全部組成單一模型。 |
撰寫的自定義模型 |
自訂分類模型
訓練集合 | 範例檔 | 您最好的解決方案 |
---|---|---|
至少兩種不同類型的檔。 | 表單、信件或檔 | 自訂分類模型 |
下一步
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應