文件智慧撰寫的自訂模型
重要
- 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。
- 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- 文件智慧服務用戶端程式庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview。
- 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
- 美國東部
- 美國西部 2
- 西歐
此內容適用於: v3.1 (GA) | 最新版本:
v4.0 (預覽版) | 舊版:
v3.0
v2.1
此內容適用於: v3.0 (GA) | 最新版本:
v4.0 (預覽版)
v3.1 | 舊版:
v2.1
此內容適用於: v2.1 | 最新版本:
v4.0 (預覽版)
組成模型。 組成模型的建立方式是取得自訂模型的集合,並將其指派給您表單類型建置的單一模型。 當使用組成模型已提交文件進行分析時,服務會執行分類以確定哪個自訂模型最能代表提交的文件。
使用組成模型,您可以將多個自訂模型指派給使用單一模型識別碼所呼叫的組成模型。 當您訓練數個模型,並想要將它們分組以分析類似的表單類型時,這非常有用。 例如,您的撰寫模型可能包含定型的自訂模型,以便分析您的供應、設備及設施購買訂單。 您可以使用組成模型來判斷每個分析和擷取的適當自訂模型,而不是手動嘗試選取適當的模型。
Custom form
和Custom template
模型可以一併組合成單一組合模型。使用模型組合作業,您最多可以將 200 個已定型的自訂模型指派給單一組成模型。 若要使用所撰寫的模型分析文件,文件智慧會先將提交的表單分類、選擇最相符的指派模型,然後傳回結果。
針對自訂範本模型,可以使用自訂範本的變化或不同的表單類型來建立組成模型。 當傳入表單屬於數個範本的其中一個時,此作業會很有用。
回應會包含
docType
屬性,指出哪一個撰寫的模型用來分析文件。針對
Custom neural
模型,最佳做法是將所有不同的單一文件類型新增至單一定型資料集,並在自訂神經模型上定型。 當您提交不同類型的文件進行分析時,這是模型組合最適合的案例。
透過引進自訂分類模型,您可以選擇在分析之前使用撰寫的模型或分類模型作為明確步驟。 如需深入了解何時使用分類或撰寫的模型,請參閱自訂分類模型。
撰寫模型限制
注意
新增自訂類神經網路之後,可以撰寫在一起的模型相容性有一些限制。
使用模型撰寫作業,您最多可以將 200 個模型指派給單一模型識別碼。 如果您想要撰寫的模型數目超過已撰寫模型的上限,則可以使用下列其中一種替代方案:
在呼叫自訂模型之前,請先分類文件。 您可以使用讀取模型,並使用程式碼、規則運算式或搜尋這類來源,以根據從文件擷取的文字和特定片語來建置分類。
如果您想要從各種結構化、半結構化和非結構化文件中擷取相同的欄位,則請考慮使用深度學習自訂神經模型。 深入了解自訂範本模型與自訂神經模型之間的差異。
使用組合模型分析文件與使用單一模型來分析文件完全相同。
Analyze Document
結果會傳回docType
屬性,指出您選取用於分析文件的元件模型。 使用個別自訂模型或組合自訂模型來分析文件的價格沒有改變。模型組合目前僅適用於「使用」標籤來訓練的自訂模型。
組成模型相容性
自訂模型類型 | 使用 v2.1 和 v2.0 定型的模型 | 自訂範本模型 v3.0 | 自訂神經模型 3.0 | 自訂神經模型 v3.1 |
---|---|---|---|---|
使用版本 2.1 和 v2.0 定型的模型 | 支援 | 已支援 | 不支援 | 不支援 |
自訂範本模型 v3.0 | 支援 | 已支援 | 不支援 | 不支援 |
自訂範本模型 v3.0 | 不支援 | 不支援 | 不支援 | 不支援 |
自訂範本模型 v3.1 | 不支援 | 不支援 | 不支援 | 不支援 |
自訂神經模型 v3.0 | 不支援 | 不支援 | 支援 | 支援 |
自訂神經模型 v3.1 | 不支援 | 不支援 | 支援 | 支援 |
若要撰寫使用舊版 API (v2.1 或更早版本) 已訓練的模型,請使用相同的標示資料集訓練 v3.0 API 模型。 此外,還會確保 v2.1 模型可與其他模型一起撰寫。
使用 API v2.1 撰寫的模型繼續受到支援,不需要更新。
針對自訂模型,可撰寫的數量上限為 200。
開發選項
文件智慧服務 v4.0:2023-02-29-preview 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
自訂模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
組成模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
文件智慧服務 v3.1:2023-07-31 (GA) 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
自訂模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
組成模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
文件智慧服務 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
自訂模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
組成模型 | • 文件智慧服務工作室 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
文件智慧 v2.1 支援下列資源:
功能 | 資源 |
---|---|
自訂模型 | • 文件智慧服務標記工具 • REST API • 用戶端程式庫 SDK • 文件智慧服務 Docker 容器 |
組成模型 | • 文件智慧服務標記工具 • REST API • C# SDK • JAVA SDK • JavaScript SDK • Python SDK |
下一步
了解如何建立和撰寫自訂模型:
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應