文件智慧服務工作室
重要
- Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
- 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview。
- 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
- 美國東部
- 美國西部 2
- 西歐
此內容適用於:v4.0 (預覽) | 舊版:
v3.1 (GA)
v3.0 (GA)
此內容適用於:v3.1 (GA) | 最新版本:
v4.0 (預覽) | 舊版:
v3.0
此內容適用於:v3.0 (GA) | 最新版本:
v4.0 (預覽)
v3.1
重要
- Document Intelligence Studio 主權雲端區域有個別的 URL。
- 適用於美國政府的 Azure: Document Intelligence Studio(Azure Fairfax 雲端)
- 由 21Vianet 營運的 Microsoft Azure: Document Intelligence Studio(中國 Azure)
文件智慧服務工作室 (英文) 是一項線上工具,可讓您以視覺化的方式探索、了解,並將文件智慧服務的功能整合到您的應用程式中。 使用 Document Intelligence Studio 來:
- 深入了解文件智慧中的不同功能。
- 使用您的檔智慧資源來測試範例檔上的模型,或上傳您自己的檔。
- 試驗不同的附加元件和預覽功能,以根據您的需求調整輸出。
- 將自訂分類模型定型以分類檔。
- 定型自定義擷取模型,以從檔擷取字段。
- 取得特定語言
SDKs
的範例程式代碼,以整合到您的應用程式中。
使用 Document Intelligence Studio 快速入門開始使用檔分析或預先建置的模型來分析檔。 使用其中 一個特定語言 SDKs
和其他快速入門,建置自定義模型並參考應用程式中的模型。
開始使用
如果您第一次造訪 Studio,請遵循 快速入門指南 來設定 Studio 以供使用。
分析選項
檔智慧支援複雜的分析功能。 Studio 允許一個進入點(分析選項按鈕)輕鬆設定附加元件功能。
根據文件擷取案例,設定分析範圍、文件頁面範圍、選擇性偵測和進階偵測功能。
注意
字型擷取未在 Document Intelligence Studio 中視覺化。 不過,您可以檢查 JSON 輸出的樣式區段,以取得字型偵測結果。
✔️ 使用預建模型或您自己的模型來自動標記文件
在自定義擷取模型標籤面中,您現在可以使用其中一個檔智慧型手機服務預先建置的模型或定型模型自動標記檔。
對於某些文件,執行自動標籤之後可能會有重複的標籤。 請務必修改標籤,以便之後在標籤頁面中沒有重複的標籤。
✔️ 自動標記資料表
您現在可以在自訂擷取模型標籤頁面中自動標記文件中的資料表,而不需要手動標記資料表。
✔️ 將測試檔案直接新增至您的定型資料集
定型自定義擷取模型之後,請視需要將測試檔上傳至定型數據集,利用測試頁面來改善模型品質。
如果某些標籤傳回較低的信賴度分數,請確定它們已正確標記。 如果未正確標記,請將它們新增至定型資料集並重新標記,以改善模型品質。
✔️ 在自訂專案中使用檔案清單選項和篩選
使用自定義擷取模型標籤面,藉由使用搜尋、篩選和依功能排序,輕鬆瀏覽您的定型檔。
利用格線檢視來預覽文件,或使用清單檢視更輕鬆地捲動瀏覽文件。
✔️ 專案共用
- 輕鬆共用自訂擷取專案。 如需詳細資訊,請參閱以自訂模型共用專案 (部分機器翻譯)。
文件智慧服務模型支援
[讀取]:試用文件智慧服務的 [讀取] 功能來擷取文字行、字組、偵測到的語言,以及偵測到的手寫樣式。 從工作室讀取功能開始。 使用範例文件和文件進行探索。 使用互動式視覺效果和 JSON 輸出來了解此功能的運作方式。 請參閱閱讀概觀以深入了解,並開始使用適用於版面配置的 Python SDK 快速入門。
[版面配置]:試用文件智慧服務的 [版面配置] 功能來擷取文字、資料表、選取標記和結構資訊。 從工作室版面配置功能開始。 使用範例文件和文件進行探索。 使用互動式視覺效果和 JSON 輸出來了解此功能的運作方式。 請參閱版面配置概觀,以深入了解,並開始使用適用於版面配置的 Python SDK 快速入門。
預建模型:文件智慧服務的預建模型可讓您將智慧型文件處理新增至應用程式和流程中,而不需要定型及建置您自己的模型。 例如,從工作室發票功能開始。 使用範例文件和文件進行探索。 使用互動式視覺效果、擷取欄位清單和 JSON 輸出來了解此功能的運作方式。 請參閱模型概觀,以深入了解,並開始使用適用於預先建置發票的 Python SDK 快速入門。
自訂擷取模型:文件智慧服務的自訂模型可讓您從使用您資料進行定型並專為表單和文件量身打造的模型來擷取欄位和值。 若要從多個窗體類型擷取數據,請建立獨立自定義模型或結合兩個或多個自定義模型,並建立組成模型。 從工作室自訂模型功能開始。 使用說明精靈、標籤介面、定型步驟和視覺效果來了解此功能的運作方式。 使用樣本文件測試自訂模型,並逐一查看以改善模型。 若要深入瞭解,請參閱自定義模型概觀以深入瞭解。
自訂分類模型:文件分類是由文件智慧服務支援的新案例。 文件分類器 API 支援分類和分割案例。 定型分類模型,以識別應用程式支援的不同文件類型。 分類模型的輸入檔案可以包含多個文件,並將每個文件分類在相關聯的頁面範圍內。 若要深入瞭解, 請參閱自定義分類模型。
附加元件功能:文件智慧服務現在支援更複雜的分析功能。 您可以使用每個模型頁面中的
Analze Options
按鈕,在文件智慧服務工作室中啟用和停用這些選擇性功能。 有四個附加元件功能可供使用:highResolution、公式、字型和條碼擷取功能。 若要深入瞭解, 請參閱附加元件功能。
下一步
瀏覽文件智慧服務工作室 (英文) 以開始使用模型和功能。
開始使用文件智慧服務工作室快速入門 (部分機器翻譯)。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應