此內容適用於:v4.0 (預覽)v3.1 (GA)v3.0 (GA)v2.1 (GA)
Azure AI 文件智慧服務是雲端式服務,其使用機器學習模型,從文件中擷取機碼值組、文字和資料表。 傳回的結果是結構化的 JSON 輸出。 文件智慧服務使用案例包括自動化資料處理、增強型資料驅動策略,以及擴充的文件搜尋功能。
概觀
Azure AI 文件智慧服務和 Azure AI 表格辨識器是相同的服務嗎?
是。
Azure AI 文件智慧服務和 Azure AI 表格辨識器是相同的服務。 該服務自 2023 年 7 月起,從 Azure AI 表格辨識器重新命名為 Azure AI 文件智慧服務。 此服務提供的功能,與重新命名之前完全相同。
價格變更:價格並未變更。 Azure 計費、成本分析、價目表和價格 API 會繼續使用「認知服務」和「應用 AI 服務」這些名稱。
重大變更:API 或用戶端程式庫並未出現重大變更。 REST API 和 SDK 版本 2024-02-29-preview、2023-10-31-preview 及後續版本將重新命名為
document intelligence
。
文件智慧服務是否與下列 Microsoft 服務整合?
AI 功能
我可以使用文件智慧服務搭配生成式 AI,以進行文件處理嗎?
是。
文件智慧服務現在包含自訂生成式,這是一種全新的擷取模型類型,使用生成式 AI 和大型語言模型 (LLM) 從文件擷取欄位。 過去,您使用 RAG (擷取增強產生器) 模式來擷取欄位。 全新的模型會使用單一 API 呼叫,來提供高品質的結果。 您還可以使用文件生成式 AI 解決方案來與您的檔案 (RAG) 聊天、從這些檔案生成吸引人的內容,以及存取資料上的 Azure OpenAI 服務模型。
透過結合 Azure AI 文件智慧服務和 Azure OpenAI,您可以建置企業應用程式,使用自然語言順暢地與文件互動。 您可以輕鬆地找到答案、取得寶貴的見解,並從現有文件產生全新且吸引人的內容。
文件智慧服務是否有助於擷取增強產生的文件內部語意區塊化?
是。
文件智慧可以提供建置組塊來啟用語意區塊化。 語意區塊化是擷取擴增生成 (RAG) 的關鍵步驟,能夠確保內容密集的區塊和改善相關性。
文件智慧服務提供版面配置模型,其期工文件的視覺效果分解、段落、區段、頁首和頁尾。
然後,您可以選擇以 Markdown 格式擷取結果,以進一步區塊化區段或段落界限上的文件。
如需詳細資訊,請參閱文件智慧服務內的 RAG 概觀
Document Intelligence Studio
我是否需要特定權限才能存取 Document Intelligence Studio?
是。
您需要至少具有讀取者角色的作用中 Azure 帳戶和訂用帳戶,才能存取文件智慧服務工作室。
針對文件分析和預先建置的模型,以下是使用者案例的角色需求:
基本
- 認知服務使用者:您需具備此使用者,文件智慧服務或 Azure 認知服務多服務資源才能使用文件智慧服務工作室。
進階
- 參與者:您需具備此角色,才能建立資源群組或文件智慧服務資源。
針對自訂模型專案,以下是使用者案例的角色需求:
基本
進階
儲存體帳戶參與者:儲存體帳戶需要此角色,才能設定跨原始來源資源分享 (CORS) 設定。 如果您重複使用相同的儲存體帳戶,只需進行一次設定即可。
參與者:您需要這個角色,才能建立資源群組和資源。 如果停用本機 (金鑰型) 驗證,則無法透過參與者或儲存體帳戶參與者角色來存取使用文件智慧服務資源或儲存體帳戶。 您仍然需要基本角色 (認知服務使用者和儲存體資料 Blob 參與者) 才能使用文件智慧服務工作室上的函式。
如需詳細資訊,請參閱 Microsoft Entra 內建角色和文件智慧服務工作室快速入門中的 Azure 角色指派相關章節。
我可以在 Document Intelligence Studio 中處理兩頁以上的文件嗎?
針對付費層資源,是。
針對免費層資源,否。
針對免費層 (F0) 資源,無論您是使用 Document Intelligence Studio、REST API 或客戶端程式庫,都只會分析前兩頁。
如果您想要分析文件中的所有頁面,請變更為付費 (S0) 資源。 在 Document Intelligence Studio 中,選取右上方的 [設定] (齒輪) 按鈕,選擇 [資源] 索引標籤,然後檢查用於分析文件的定價層。
可以變更 Document Intelligence Studio 中的目錄或訂閱嗎?
是。
若要變更文件智慧服務工作室中的目錄,請選取 [設定] (齒輪) 按鈕。 在 [目錄] 下,從清單中選取目錄,然後選取 [切換目錄]。 切換目錄之後,請再次登入。
若要變更訂用帳戶或資源,請移至 [設定] 底下的 [資源] 索引標籤。
我可以使用 Document Intelligence Studio 搭配設有防火牆或虛擬網路的資源嗎?
是。
如果您的文件智慧資源已設有防火牆或虛擬網路,您必須將專用 IP 位址 20.3.165.95 新增至文件智慧資源的防火牆允許清單。 自定義專案中的某些函式(例如,自動標籤、專案管理和迴圈中的人類)如果停用公用網路存取,則無法運作。
當我透過「從 URL 擷取」函式上傳文件智慧服務 Studio 中的檔案時,是否可以使用來自 Blob 儲存體的 URL?
是。
如果您的 Azure Blob 記憶體 URL 包含 SAS 令牌,而且可從公用網路存取。 您無法針對已停用金鑰存取或防火牆/VNet 後方的記憶體帳戶使用 Fetch 函式。
我可以重複使用或自訂文件智慧服務工作室中的標籤體驗,並將其建置到自己的應用程式嗎?
是。
文件智慧服務工作室的標籤體驗是工具組存放庫 (英文) 中的開放原始碼。
文件智慧服務主權雲端區域是否有個別的 URL 端點?
是。
Document Intelligence Studio 擁有個別的 URL 端點可用於主權雲端區域:
Azure 美國政府雲端的 URL (Azure Fairfax):Document Intelligence Studio 美國政府 (英文)。
由 21Vianet 營運的 Microsoft Azure URL (Azure 中國):Document Intelligence Studio 中國 (英文)。
應用程式開發
我可以使用最新的開發選項,透過 Azure AI 文件智慧服務開發應用程式嗎?
是。
文件智慧服務會在下列平台中提供最新開發選項:
[REST API](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
我可以將應用程式移轉至最新版本的文件智慧服務嗎?
是。
下表提供移轉至最新版文件智慧服務的詳細指示連結:
語言/API | 移轉指南 |
---|---|
REST API | v3 |
C#/.NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
我可以指定文件中要分析的頁面範圍嗎?
是。
使用 pages
參數 (在 v2.1、v3.0 和更新版本的 REST API 中支援),並指定多頁 PDF 和 TIFF 文件的頁面。 接受的輸入包括下列範圍:
- 單一頁面。 例如,如果您指定
1, 2
,將會處理第 1 頁和 2 頁。 - 有限範圍。 例如,如果您指定
2-5
,將會處理第 2 到 5 頁。 - 開放式範圍。 例如,如果您指定
5-
,將會處理從第 5 頁往後的所有頁面。 如果您指定-10
,將會處理第 1 到 10 頁。
您可以將這些參數混合在一起,且範圍可以重疊。 例如,如果您指定 -5, 1, 3, 5-10
,將會處理第 1 到 10 頁。
如果服務可以處理至少一頁的文件,服務會接受要求。 例如,在五頁的文件上使用 5-100
是有效輸入,代表處理第 5 頁。
如果您沒有提供頁面範圍,則會處理整個文件。
您是否建議在我的專案上使用 Document Intelligence Studio,而不是使用 FOTT Sample Labeling 工具?
是。
因為文件智慧服務可以縮短設定文件智慧服務資源和儲存體服務的時間,所以建議您在大部分情況下使用文件智慧服務 (英文)。
針對下列案例,請考慮使用 Form Testing Tool (FOTT):
您的資料必須保留在單一機器內。 使用 FOTT 範例標記工具和文件智慧服務容器。
您的專案高度相依於文件智慧服務 V2.1,而且您想要繼續使用 v2.1 API。
是否存在緩和節流的最佳做法?
是。
文件智慧服務會使用自動調整來依需求提供所需的計算資源,同時讓客戶保持低成本。 若要緩和自動調整期間的節流,我們建議使用下列方法:
在您的應用程式中實作重試邏輯。
如果您發現
POST
要求數目受到節流,請考慮在要求之間加上延遲。逐漸增加工作負載。 避免大幅變更。
建立支援要求,以提高每秒交易 (TPS) 上限。
深入了解文件智慧服務服務配額和限制。
自訂模型
我可以改善自訂模型的估計正確度分數嗎?
是。
文件視覺結構變異數會影響模型的精確度。 以下是一些提示:
在定型資料集中包含文件的所有變化。 這些變化包括不同的格式,例如數位與掃描的 PDF。
區分視覺呈現上不同的文件類型並訓練不同的模型。
確定沒有無關的標籤。
針對簽章和區域標記,請勿包含周圍文字。
如需詳細資訊,請參閱精確度和信賴分數。
我可以重新訓練自訂模型嗎?
否。
文件智慧服務沒有明確的重新訓練作業。 每個訓練作業都會產生新的模型。
如果您發現模型需要重新訓練,您可以在訓練資料集中新增更多樣本,然後訓練新的模型。
您也可以建立新的模型,以使用原始模型進行組成,如下所示:
為您的新範本建立資料集。
標記並訓練新的模型。
驗證新模型對您的特定文件類型有良好成效。
將新的模型與現有模型組合成單一端點。 接著,文件智慧服務就可以為要分析的每份文件決定最佳模型。
如需詳細資訊,請參閱組成模型。
我可以將已訓練的模型從一個環境 (例如 Beta) 移至另一個環境 (例如實際執行環境) 嗎?
是。
您可以使用複製 API,將自訂模型從一個文件智慧服務帳戶複製到任意支援地理區域中的其他帳戶。 如需詳細指示,請參閱災害復原。
複製作業僅適用於複製您訓練該模型所在的特定雲端環境。 例如,不支援將模型從公用雲端複製到 Azure Government 雲端。
訓練自訂模型時,我是否需要付費?
是。
所有自訂的生成式和自訂範本模型都可以免費進行訓練。 不過,為所有模型建立訓練資料集需要對訓練文件執行版面配置模型。 客戶須負擔此成本。
自訂生成式模型也依賴自動標記功能來加速產生已標記的資料集。 此動作具有相關的成本。 雖然範本和生成模型建置作業是免費的,但建立加上標籤的資料集可能會產生一些最低成本。
針對 v4.0 2024-07-31-preview
,自訂神經模型可以免費訓練,最多 10 小時。 無論您是將單一模型定型為 10 小時,還是將多個模型定型為總計 10 小時,您都不需要支付前 10 小時的費用。 使用免費 10 小時之後,系統 會自動向您收取額外的訓練時數。 如需價格的詳細資料,請參閱 [定價頁面]。 這個新的付費訓練功能可讓訓練模型延長持續時間來處理較大的文件。 如需此付費訓練功能的詳細資料,請查看 自訂神經模型計費一節。
針對 v3.0 2022-08-31
或 v3.1 2023-07-31
,自訂神經模型可以免費訓練 20 個訓練工作階段,每個工作階段的訓練持續時間上限為 30 分鐘。 一旦您用完所有 20 個訓練工作階段,您就可以提交 Azure 支援票證來增加訓練工作階段限制。 若要增加限制,會將兩個訓練課程視為一個訓練小時,而每兩個課程/一個訓練小時收費。 如需價格的詳細資料,請參閱 [定價頁面]。 如需增加限制方式的詳細資料,請查看 自訂神經模型計費一節。 針對 v3.0
和 v3.1
,付費訓練功能無法使用。 自訂神經模型的付費訓練功能僅適用於 v4.0
。
儲存體帳戶
儲存體帳戶驗證的共用存取簽章 (SAS) 權杖是否會過期?
是。
當您建立共用存取簽章 (SAS) 時,預設持續時間為 48 小時。 48 小時之後,您必須建立新的權杖。
請考慮設定較長的持續時間期間,作為您透過文件智慧服務使用儲存體帳戶的時間。
如果儲存體帳戶位於虛擬網路或防火牆後方,文件智慧服務可以存取儲存體帳戶中的資料嗎?
不行,無法直接存取。
如果儲存體帳戶受到虛擬網路或防火牆保護,文件智慧服務就無法存取您的儲存體帳戶。
不過,私人 Azure 儲存體帳戶存取和驗證支援 Azure 資源的受控識別。 當您使用受控識別時,文件智慧服務可以使用指派的認證來存取您的儲存體帳戶。
如果您想要使用 FOTT 分析私人儲存體帳戶資料,您必須將工具部署在虛擬網路或防火牆內部。
深入了解如何為您的文件智慧服務資源建立和使用受控識別 (部分機器翻譯)。
容器
未連線和連線容器之間是否存在差異?
是。
雖然已連線和已未連線容器的模型功能相同,但計費和連線方法卻不同:
連線容器會使用您 Azure 帳戶上的文件智慧服務資源,將計費資訊傳送至 Azure。 使用連線的容器時,需要網際網路連線才能將帳單資訊傳送至 Azure。 文件智慧服務連線容器會使用您 Azure 帳戶上的文件智慧服務資源,將計費資訊傳送至 Azure。 連線的容器不會將客戶資料 (例如正在分析的影像或文字) 傳送至 Microsoft。 如需連線容器傳送至 Microsoft 計費資訊的範例,請參閱 Azure AI 容器常見問題 (部分機器翻譯)。
中斷連線的容器 (部分機器翻譯) 可讓您使用未連線至網際網路的 API。 計費資訊 (部分機器翻譯) 不會透過網際網路傳送。 系統會改為依據購買的承諾用量服務層級計費。 目前,未連線的容器使用量可用於文件智慧服務的自訂和發票模型。
我可以將本機儲存體用於文件智慧服務範例標記工具 (FOTT) 容器嗎?
是。
FOTT 具有使用本機儲存體的版本。 該版本必須安裝在 Windows 機器上。 您可以從此位置進行安裝。
在專案頁面上,如果您的標籤檔案位於子目錄中,請將標籤資料夾 URI 指定為 /shared 或 /shared/sub-dir。 所有其他文件智慧服務範例標籤工具的行為與託管服務相同。
向上擴充的最佳作法為何?
是。
針對非同步呼叫,您可以使用共用儲存體執行多個容器。 處理 POST
分析呼叫的容器會將輸出儲存在儲存體中。 然後,任何其他容器都可以從儲存體擷取結果,並處理 GET
呼叫。 該要求識別碼不會繫結至容器。
針對同步呼叫,您可以執行多個容器,但只有一個容器會處理要求。 因為其屬於封鎖呼叫,所以來自集區的任何容器都可以處理要求並傳送回應。 此時,一次只有一個容器繫結至要求,而且不需要輪詢。
是否能設定具有共用儲存體的容器?
是。
容器會在啟動時使用 Mounts: Shared
屬性來指定儲存處理檔案的共用儲存體。 若要查看這個屬性的使用,請參閱容器文件。
安全性與隱私權
文件智慧服務是否會儲存我的資料?
是,但只會短暫儲存。
對於所有功能,文件智慧服務會暫時將資料和結果儲存在 Azure 儲存體中 (位於與要求相同的區域)。 然後,您的資料會在分析要求提交後的 24 小時內刪除。
深入了解文件智慧服務的資料、隱私權和安全性 (英文)。
針對已訓練的自訂模型,分析和加上標籤之後的過渡輸出會儲存至訓練資料所在的相同 Azure 儲存體位置。 已訓練的自訂模型會儲存在相同區域中的 Azure 儲存體中,並以邏輯方式與您的 Azure 訂閱和 API 認證隔離。
更多說明及支援
是否有其他資源可用來提供 Azure AI 文件智慧服務問題的解決方案?
是。
Microsoft 問答集整理了 Microsoft 的技術問題與解答,您可在此處找到答案。 您可以篩選出文件智慧服務特定的查詢。
如果在標記文件時,服務無法辨識特定文字或辨識錯誤,我可以提供直接意見反應嗎?
是。
我們會持續更新及改善文件智慧服務模型。 您可以傳送電子郵件給文件智慧服務小組。 可能的話,請分享已醒目提示問題的範例文件。