共用方式為


服務配額和限制

此內容適用於:勾選記號 v4.0 (預覽版) | 較舊版本: blue-checkmark v3.1 (GA) blue-checkmark v3.0 (GA)

此內容適用於:勾選記號 v2.1 | 最新版本:blue-checkmark v4.0 (預覽版)

本文同時包含 Azure AI 文件智慧服務在所有定價層的配額和限制的快速參考及詳細描述。 其也包含一些避免要求節流的最佳做法。

模型使用方式

支援的文件類型 參閱 版面配置 預建模型 自訂模型 附加元件功能
PDF ✔️ ✔️ ✔️ ✔️ ✔️
影像:JPEG/JPGPNGBMPTIFFHEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office:DOCXPPTXXLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = 支援 ✖️ = 不支援

支援的文件類型 參閱 版面配置 預建模型 自訂模型
PDF ✔️ ✔️ ✔️ ✔️
影像:JPEG/JPGPNGBMPTIFFHEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office:DOCXPPTXXLS ✔️ ✖️ ✖️ ✖️

✔️ = 支援 ✖️ = 不支援

計費

文件智慧服務計費會每月根據分析的模型類型和頁數來計費。 您可以在 Azure 入口網站計量儀表板中找到使用計量。 儀表板會顯示 Azure 文件智慧服務所處理的頁數。 您可以使用 Azure 定價計算機來檢查花費在該資源上的預估成本。 如需詳細指示,請參閱檢查我的使用量及預估成本。 以下是一些詳細資料:

  • 當您提交文件進行分析時,服務會分析所有頁面,除非您在要求中使用 pages 參數來指定頁面範圍。 透過讀取、OCR 或版面配置模型分析 Microsoft Excel 和 PowerPoint 文件時,服務會將每個 Excel 工作表和 PowerPoint 投影片計算為一頁。

  • 在分析 PDF 和 TIFF 檔案時,服務會將 PDF 檔案中的每個頁面或 TIFF 檔案中的每個影像計算為一個頁面,且沒有字元上限。

  • 在分析讀取和版面配置模型支援的 Microsoft Word 和 HTML 檔案時,服務會將每 3,000 個字元的區塊計算為一頁。 例如,若您的文件包含 7,000 個字元,則會分成兩個 3,000 個字元的頁面、一個 1,000 個字元的頁面,加起來總共三頁。

  • 讀取和版面配置模型不支援分析 Microsoft Word、Excel、PowerPoint 和 HTML 檔案中內嵌或連結的影像。 因此,服務不會將這些內容計算為新增的影像。

  • 使用文件智慧服務定型自訂模型一律免費。 只有在服務使用模型來分析文件時,才會向您收取費用。

  • 容器定價與雲端服務定價相同。

  • 文件智慧服務提供的免費層 (F0) 可讓您測試所有文件智慧服務功能。

  • 文件智慧服務具有適用於大型工作負載的承諾用量型定價模式。

  • 需要配置模型,才能產生資料集的標籤以進行自訂訓練。 如果您用於自訂訓練的資料集沒有可用的標籤檔案,服務就會為您產生標籤檔案,並向您收取配置模型使用量的費用。

配額 免費 (F0)1 標準 (S0)
每秒交易數限制 1 15 (預設值)
可調整 No 2
文件大小上限 4 MB 500 MB
可調整 No No
頁數上限 (分析) 2 2000
可調整 No No
標籤檔案的大小上限 10 MB 10 MB
可調整 No No
OCR json 回應的大小上限 500 MB 500 MB
可調整 No No
範本模型數目上限 500 5000
可調整 No No
神經模型數目上限 100 500
可調整 No No

自訂模型使用方式

配額 免費 (F0) 1 標準 (S0)
撰寫模型限制 5 200 (預設值)
可調整 No No
定型資料集大小 * 類神經 1 GB 3 1 GB (預設值)
可調整 No No
定型資料集大小 * 範本 50 MB 4 50 MB (預設值)
可調整 No No
頁數上限 (定型) * 範本 500 500 (預設值)
可調整 No No
頁數上限 (定型) * 類神經 50,000 50,000 (預設值)
可調整 No No
自訂神經模型定型 每月美金 10 元 每月美金 20 元
可調整 No 3
頁數上限 (定型) * 分類器 10,000 10,000 (預設值)
可調整 No No
文件類型 (類別) 數目上限 * 分類器 500 500 (預設值)
可調整 No No
定型資料集大小 * 分類器 1GB 1GB (預設值)
可調整 No No
每個類別的範例數目下限 * 分類器 5 5 (預設值)
可調整 No No

自訂模型限制

配額 免費 (F0) 1 標準 (S0)
撰寫模型限制 5 200 (預設值)
可調整 No No
定型資料集大小 50 MB 50 MB (預設值)
可調整 No No
頁數上限 (定型) 500 500 (預設值)
可調整 No No

1 如需 免費 (F0) 定價層,另請參閱定價頁面的每月額度。
2 請參閱最佳做法和 [調整指示 (#create-and-submit-support-request)。
3 神經模型定型計數會在每個日曆月份重設。 提出支援要求來提高每月定型限制。

4 此限制適用於任何標籤相關更新之前在定型資料集資料夾中找到的所有文件。

詳細描述、配額調整和最佳做法

在要求增加配額 (如果適用) 之前,請確定有必要。 文件智慧服務使用自動調整來導入必要的計算資源 on-demand、壓低客戶成本,並透過不維持過量的硬體容量來取消佈建未使用的資源。

如果您的應用程式傳回回應碼 429 (太多要求),而且您的工作負載在定義的限制內,最有可能是因為服務正在擴大以符合您的需求,但尚未達到所需的規模。 因此,服務不會立即擁有足夠的資源以針對要求提供服務。 此狀態是暫時性的,應該不會長時間持續。

在自動調整期間降低節流的一般最佳做法

若要將節流 (回應碼 429) 的相關問題降至最低,我們建議使用下列技術:

  • 在您的應用程式中實作重試邏輯
  • 避免工作負載急遽變化。 逐漸增加工作負載
    例如: 應用程式使用文件智慧服務,而目前的工作負載是 10 TPS (每秒交易數)。 在下一秒,您將負載增加到 40 TPS (也就是提高到四倍)。 服務會立即開始擴大以滿足新的負載,但可能無法在一秒內完成,因此部分要求會收到回應碼 429。

下一節將描述調整配額的特定案例。 跳至文件智慧服務:增加並行要求限制

提高每秒交易數要求限制

針對文件智慧服務資源,每秒交易數預設以每秒 15 筆交易為限。 若為標準定價層,則可以增加此限制數量。 提交要求之前,請確定您熟悉本節的內容,並了解這些最佳做法

增加並行要求限制並不會直接影響成本。 文件智慧服務使用「用多少付多少」模式。 此限制會定義服務在開始對要求進行節流之前可調整的上限。

現有的並行要求限制參數值無法透過 Azure 入口網站、命令列工具或 API 要求看到。 若要確認現有值,請建立 Azure 支援要求。

如果您想要每秒增加交易數,您可以在資源上啟用自動調整。 請遵循本文件,在您的資源上啟用自動調整 * 啟用自動調整。 您也可以提交增加 TPS 支援要求。

備妥所需的資訊

  • 文件智慧服務資源識別碼

  • 區域

  • 基本模型資訊:

    • 登入 Azure 入口網站
    • 選取您要提高交易限制的文件智慧服務資源
    • 選取 -屬性- (-資源管理-群組)
    • 複製並儲存下列欄位的值:
      • 資源識別碼
      • 位置 (您的端點區域)

建立並提交支援要求

提交支援要求,以開始提高資源的每秒交易數 (TPS) 限制:

  • 請確定您備妥所需的資訊
  • 登入 Azure 入口網站
  • 選取您要提高 TPS 限制的文件智慧服務資源
  • 選取 -新支援要求- (-支援 + 疑難排解- 群組)。 新視窗即會出現,其中會自動填入 Azure 訂用帳戶和 Azure 資源的相關資訊
  • 輸入 -摘要- (例如「增加文件智慧服務 TPS 限制」)
  • 在問題類型欄位,選取 [配額或使用量驗證]。
  • 選取 -下一步:解決方案-
  • 繼續進行建立要求的作業
  • 在 [詳細資料] 索引標籤下,在 -描述- 欄位中輸入下列資訊:
    • 請注意,要求是關於文件智慧服務的配額。
    • 提供您想要調整來達到的 TPS 預期。
    • 收集的 Azure 資源資訊。
    • 完成輸入必要資訊,然後選取 -檢閱 + 建立- 索引標籤中選取 -建立- 按鈕
    • 請記下 Azure 入口網站通知中的支援要求編號。 希望客戶支援儘快與您連絡,以進一步進行處理。

工作負載模式最佳做法的範例

此範例會顯示我們建議的方法,以減少因進行自動調整所造成的可能要求節流。 這不是準確做法,只是我們建議遵循的範本,請視需要調整。

假設文件智慧服務資源已設定預設限制。 啟動工作負載以提交您的分析要求。 如果您發現經常看到節流,回應碼為 429,首先請在 GET 分析回應要求上實作指數輪詢。 在連續錯誤回應的重試之間,使用越來越長的等候時間,例如要求之間 2-5-13-34 的延遲模式。 一般而言,針對對應的 POST 要求,我們建議不要每 2 秒呼叫 GET 分析回應一次以上。

針對提交的文件,如果您發現 POST 要求數目受到節流,請考慮在要求之間加上延遲。 如果工作負載需要更高度的同時處理,則您必須建立支援要求,以提高每秒交易數的服務限制。

一般而言,在進入實際執行環境之前,我們建議先測試工作負載和工作負載模式。

下一步