服務配額和限制
此內容適用於:v4.0 (預覽) | 舊版:v3.1 (GA)v3.0 (GA)
此內容適用於:v2.1 | 最新版本:v4.0(預覽)
本文同時包含 Azure AI 文件智慧服務在所有定價層的配額和限制的快速參考及詳細描述。 其也包含一些避免要求節流的最佳做法。
模型使用方式
支援的檔案類型 | 參閱 | 版面配置 | 預建模型 | 自訂模型 | 附加元件功能 |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
影像:JPEG/JPG 、、、BMP PNG 、TIFF 、HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX 、、 PPTX 、 XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = 支援 ✖️ = 不支援
支援的檔案類型 | 參閱 | 版面配置 | 預建模型 | 自訂模型 |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
影像:JPEG/JPG 、、、BMP PNG 、TIFF 、HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX 、、 PPTX 、 XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = 支援 ✖️ = 不支援
配額 | 免費 (F0)1 | 標準 (S0) |
---|---|---|
每秒交易數限制 | 1 | 15 (預設值) |
可調整 | No | 是 2 |
文件大小上限 | 4 MB | 500 MB |
可調整 | No | No |
頁數上限 (分析) | 2 | 2000 |
可調整 | No | No |
標籤檔案的大小上限 | 10 MB | 10 MB |
可調整 | No | No |
OCR json 回應的大小上限 | 500 MB | 500 MB |
可調整 | No | No |
範本模型數目上限 | 500 | 5000 |
可調整 | No | No |
神經模型數目上限 | 100 | 500 |
可調整 | No | No |
自訂模型使用方式
配額 | 免費 (F0) 1 | 標準 (S0) |
---|---|---|
撰寫模型限制 | 5 | 200 (預設值) |
可調整 | No | No |
定型資料集大小 * 類神經 | 1 GB 3 | 1 GB (預設值) |
可調整 | No | No |
定型資料集大小 * 範本 | 50 MB 4 | 50 MB (預設值) |
可調整 | No | No |
頁數上限 (定型) * 範本 | 500 | 500 (預設值) |
可調整 | No | No |
頁數上限 (定型) * 類神經 | 50,000 | 50,000 (預設值) |
可調整 | No | No |
自訂神經模型定型 | 每月美金 10 元 | 每月美金 20 元 |
可調整 | No | 是 3 |
頁數上限 (定型) * 分類器 | 10,000 | 10,000 (預設值) |
可調整 | No | No |
檔案類型數目上限 (類別) * 分類器 | 500 | 500 (預設值) |
可調整 | No | No |
定型資料集大小 * 分類器 | 1GB | 1GB (預設值) |
可調整 | No | No |
每個類別的樣本數目下限 * 分類器 | 5 | 5 (預設值) |
可調整 | No | No |
自訂模型限制
配額 | 免費 (F0) 1 | 標準 (S0) |
---|---|---|
撰寫模型限制 | 5 | 200 (預設值) |
可調整 | No | No |
定型資料集大小 | 50 MB | 50 MB (預設值) |
可調整 | No | No |
頁數上限 (定型) | 500 | 500 (預設值) |
可調整 | No | No |
1 如需 免費 (F0) 定價層,另請參閱定價頁面的每月額度。
2 請參閱最佳做法和 [調整指示 (#create-and-submit-support-request)。
3 神經模型定型計數會在每個日曆月份重設。 提出支援要求來提高每月定型限制。
4 此限制適用於任何標籤相關更新之前在定型資料集資料夾中找到的所有文件。
詳細描述、配額調整和最佳做法
在要求增加配額 (如果適用) 之前,請確定有必要。 Document Intelligence 服務會使用自動調整來帶來所需的計算資源 on-demand
、降低客戶成本,並藉由不維護過多的硬體容量來取消布建未使用的資源。
如果您的應用程式傳回回應碼 429 (要求太多),且您的工作負載在定義的限制內:最有可能,服務會相應增加至您的需求,但尚未達到所需的規模。 因此,服務不會立即擁有足夠的資源以針對要求提供服務。 此狀態是暫時性的,應該不會長時間持續。
在自動調整期間降低節流的一般最佳做法
若要將節流 (回應碼 429) 的相關問題降至最低,我們建議使用下列技術:
- 在您的應用程式中實作重試邏輯
- 避免工作負載急遽變化。 逐漸增加工作負載
例子。 應用程式使用文件智慧服務,而目前的工作負載是 10 TPS (每秒交易數)。 在下一秒,您將負載增加到 40 TPS (也就是提高到四倍)。 服務會立即開始擴大以滿足新的負載,但可能無法在一秒內完成,因此部分要求會收到回應碼 429。
下一節將描述調整配額的特定案例。 跳至文件智慧服務:增加並行要求限制
提高每秒交易數要求限制
針對文件智慧服務資源,每秒交易數預設以每秒 15 筆交易為限。 若為標準定價層,則可以增加此限制數量。 提交要求之前,請確定您熟悉本節的內容,並了解這些最佳做法。
增加並行要求限制並不會直接影響成本。 文件智慧服務使用「用多少付多少」模式。 此限制會定義服務在開始對要求進行節流之前可調整的上限。
現有的並行要求限制參數值無法透過 Azure 入口網站、命令列工具或 API 要求看到。 若要確認現有值,請建立 Azure 支援要求。
如果您想要每秒增加交易數,您可以在資源上啟用自動調整。 請遵循本文件,在您的資源上啟用自動調整 * 啟用自動調整。 您也可以提交增加 TPS 支援要求。
備妥所需的資訊
文件智慧服務資源識別碼
區域
如何取得資訊 (基底模型):
- 登入 Azure 入口網站
- 選取您要提高交易限制的文件智慧服務資源
- 選取 [屬性] ([資源管理] 群組)
- 複製並儲存下列欄位的值:
- 資源識別碼
- 位置 (您的端點區域)
建立並提交支援要求
提交支援要求,以開始提高資源的每秒交易數 (TPS) 限制:
- 請確定您備妥所需的資訊
- 登入 Azure 入口網站
- 選取您要提高 TPS 限制的文件智慧服務資源
- 選取 [新增支援要求] ([支援 + 疑難排解] 群組)
- 新視窗即會出現,其中會自動填入 Azure 訂用帳戶和 Azure 資源的相關資訊
- 輸入「摘要」 (例如「新增文件智慧服務 TPS 限制」)
- 在 [問題類型] 中,選取 [配額或使用量驗證]
- 選取 [下一步:解決方案]
- 繼續進行建立要求的作業
- 在 [詳細資料] 索引標籤下,在 [描述] 欄位中輸入下列資訊:
- 請注意,要求是關於文件智慧服務的配額。
- 提供您想要調整來達到的 TPS 預期。
- 您收集的 Azure 資源資訊。
- 完成輸入必要資訊,然後在 [檢閱 + 建立] 索引標籤中選取 [建立] 按鈕
- 請記下 Azure 入口網站通知中的支援要求編號。 我們很快就會與您連絡,以進行後續處理
工作負載模式最佳做法的範例
此範例會顯示我們建議的方法,以減少因進行自動調整所造成的可能要求節流。 這不是準確做法,只是我們建議遵循的範本,請視需要調整。
假設文件智慧服務資源已設定預設限制。 啟動工作負載以提交您的分析要求。 如果您發現經常看到節流,回應碼為 429,首先請在 GET 分析回應要求上實作指數輪詢。 在連續錯誤回應的重試之間,使用越來越長的等候時間,例如要求之間 2-5-13-34 的延遲模式。 一般而言,我們建議不要針對對應的POST要求,每隔2秒呼叫 get analyze 回應一次以上。
針對提交的文件,如果您發現 POST 要求數目受到節流,請考慮在要求之間加上延遲。 如果工作負載需要更高度的同時處理,則您必須建立支援要求,以提高每秒交易數的服務限制。
一般而言,建議您先測試工作負載和工作負載模式,再進入生產環境。
下一步
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應