語音服務配額和限制

2025-04-23

本文包含 Azure AI 服務中語音服務配額和限制的快速參考和詳細描述。此資訊適用於服務的所有定價層。其也包含一些避免要求節流的最佳做法。

對於免費 (F0) 定價層，另請參閱定價頁面上的每月額度。

配額和限制參考

下列各節提供適用於語音服務的配額和限制快速指南。

如需標準 (S0) 語音資源可調整配額的相關資訊，請參閱更多說明、最佳做法和調整指示。無法調整免費 (F0) 語音資源的配額和限制。

重要

如果您將適用於語音的 AI Foundry 資源從免費（F0）切換至標準（S0）定價層，對應的配額變更最多可能需要數小時的時間。

每個資源的語音轉換文字配額和限制

本節說明每個語音資源的語音轉換文字配額和限制。除非另有指定，否則限制無法調整。

即時語音轉換文字及語音翻譯

您可以使用即時語音轉換文字搭配語音 SDK 或短音訊的語音轉換文字 REST API。

重要

這些限制同時適用於即時語音轉換文字要求及語音翻譯要求。例如，如果您有 60 個同時的語音轉換文字要求和 40 個同時的語音翻譯要求，您將達到 100 個同時要求的限制。

配額	免費 (F0)	標準 (S0)
並行要求限制 - 基底模型端點	1 此限制無法調整。	100 (預設值) 可調整標準 (S0) 資源的速率。請參閱更多說明、最佳做法和調整指示。
並行要求限制 - 自訂端點	1 此限制無法調整。	100 (預設值) 可調整標準 (S0) 資源的速率。請參閱更多說明、最佳做法和調整指示。
即時自動分段標記的最大音訊長度。	N/A	每個檔案 240 分鐘

快速轉錄

配額	免費 (F0)	標準 (S0)
音訊輸入檔案大小上限	N/A	300 MB
音訊長度上限	N/A	每個檔案需 120 分鐘
每分鐘要求數上限	N/A	600

批次轉譯

配額	免費 (F0)	標準 (S0)
語音轉換文字 REST API 限制	F0 無法使用	每 10 秒 100 個要求 (每分鐘 600 個要求)
音訊輸入檔案大小上限	N/A	1 GB
每個容器的 Blob 數目上限	N/A	一萬
每個謄寫要求的檔案數目上限 (當您使用多個內容 URL 作為輸入時)。	N/A	1000
啟用自動分段標記的轉譯音訊長度上限。	N/A	每個檔案 240 分鐘

模型自訂

當您建立自訂語音模型時，此表格中的限制會套用至每個語音資源。

配額	免費 (F0)	標準 (S0)
REST API 限制	每 10 秒 100 個要求 (每分鐘 600 個要求)	每 10 秒 100 個要求 (每分鐘 600 個要求)
每個語音資源的自定義模型部署數目上限	1	50
語音資料集的數目上限	2	500
用於資料匯入的原音資料集檔案大小上限	2 GB	2 GB
用於資料匯入的語言資料集檔案大小上限	200 MB	1.5 GB
用於資料匯入的發音資料集檔案大小上限	1 KB	1 MB
在 `text` API 要求中使用參數時的文字大小上限	200 KB	500 KB

每個資源的文字轉換語音配額和限制

本節說明每個語音資源的文字轉語音額度及限制。

即時文字轉換語音

您可以使用語音 SDK或文字轉換語音 REST API的即時文字轉語音功能。除非另有指定，否則限制無法調整。

配額	免費 (F0)	標準 (S0)
標準語音和自定義語音每個時段的交易數目上限。	每 60 秒 20 筆交易此限制無法調整。	每秒 200 筆交易 (TPS) (預設值) 標準 (S0) 資源的速率可調整至最高 1000 TPS。請參閱更多說明、最佳做法和調整指示。
每次請求產生的音訊長度上限	10 分鐘	10 分鐘
SSML 中相異 `<voice>` 和 `<audio>` 標籤的總數上限	50	50
Websocket 每回合的 SSML 訊息大小上限	64 KB	64 KB

批次合成

這些限制無法調整。如需批次合成延遲的詳細資訊，請參閱批次合成延遲和最佳做法。

配額	免費 (F0)	標準 (S0)
REST API 限制	F0 無法使用	每 10 秒 100 個要求
建立合成作業的 JSON 承載大小上限	N/A	2 兆字節
並行作用中合成作業	N/A	無限制
每個合成作業的文字輸入數目上限	N/A	一萬
合成作業存留時間上限，因為其處於最終狀態	N/A	最多 31 天 (使用屬性指定)

自訂語音 - 專業

當您建立專業語音時，此表格中的限制適用於每個語音資源。

配額	免費 (F0)	標準 (S0)
每秒交易數目 (TPS) 上限	F0 無法使用	每秒 200 筆交易 (TPS) (預設值)
資料集數目上限	N/A	500
同時資料集上傳數目上限	N/A	5
每個資料集用於資料匯入的資料檔案大小上限	N/A	2 GB
上傳長音訊或不含指令碼的音訊	N/A	是的
同時模型定型數目上限	N/A	4
自訂端點數目上限	N/A	50

自訂語音 - 個人語音

當您建立個人版語音時，此表格中的限制會套用至每個語音資源。

配額	免費 (F0)	標準 (S0)
REST API 限制 (不包括語音合成)	F0 無法使用	每 10 秒 50 個要求
語音合成的每秒交易數 (TPS) 最大上限	F0 無法使用	每秒 200 筆交易 (TPS) (預設值)

批次文字轉換語音虛擬人偶

配額	免費 (F0)	標準 (S0)
REST API 限制	F0 無法使用	每分鐘 2 個要求

即時文字轉換語音虛擬人偶

配額	免費 (F0)	標準 (S0)
每分鐘的新連線數	F0 無法使用	每分鐘新增 2 個連線
說話的連線持續時間上限	F0 無法使用	30 分鐘¹
閒置狀態的連線持續時間上限	F0 無法使用	5 分鐘

¹ 若要確保即時虛擬人偶的持續作業超過 30 分鐘，您可以啟用自動重新連線。如需如何設定自動重新連線的資訊，請參閱此範例程式碼 (搜尋「自動重新連線」)。

音訊內容建立工具

配額	免費 (F0)	標準 (S0)
檔案大小 (SSML 中的純文字)¹	每個檔案 3,000 個字元	每個檔案 20,000 個字元
檔案大小 (語彙檔案)²	每個檔案 30 KB	每個檔案 100 KB
SSML 中的可計費字元	每個檔案 15,000 個字元	每個檔案 100,000 個字元
匯出至音訊庫	1 個並行工作	N/A

¹ 限制僅適用於 SSML 中的純文字，且不包含標記。

² 語彙檔案中的字元不會產生費用。只有 SSML 中的語彙元素會計入可計費字元。若要深入了解，請參閱可計費字元。

每個資源的說話者辨識配額和限制

說話者辨識限制為每秒 20 筆交易 (TPS)。

詳細說明、配額調整和最佳做法

語音服務的部分配額是可以調整的。本節提供更多說明、最佳做法和調整指示。

以下是可調整的標準 (S0) 資源配額。免費（F0）請求限制無法調整。

基底模型端點和自訂端點的語音轉換文字並行要求限制
標準語音和自定義語音每個時段的文字到語音轉換交易數目上限
語音翻譯併發請求限制

在要求增加配額 (如果適用) 之前，請先檢查您目前的 TPS (每秒交易數) 並確定有必要增加配額。語音服務會使用自動調整技術，以隨選模式帶入所需的計算資源。同時，語音服務會嘗試不維持過多的硬體容量，以降低成本。

讓我們看看下列範例。假設您的應用程式收到回應碼 429，則表示要求太多。即使您的工作負載位於配額和限制參考所定義的限制內，您的應用程式仍會收到此回應。最可能的解釋是語音服務擴充至滿足您的需求，但尚未達到所需的規模。因此，服務不會立即擁有足夠的資源以針對要求提供服務。在這種情況下，增加配額沒有任何幫助。在大部分情況下，語音服務很快就會相應增加，而造成回應碼 429 的問題將會解決。

在自動調整期間降低節流的一般最佳做法

若要盡量減少與節流相關問題，最好使用下列技術：

在您的應用程式中實作重試邏輯。
避免工作負載急遽變化。逐漸增加工作負載。例如，假設應用程式使用的是文字轉換語音，而您目前的工作負載是 5 TPS。在下一秒，您將負載增加到 20 TPS (也就是超過四倍)。語音服務會立即開始擴充以滿足新負載，但無法在一秒內視需要進行調整。有些要求會收到回應碼 429 (太多要求)。
測試不同的負載增加模式。如需詳細資訊，請參閱工作負載模式範例。
在不同區域建立更多語音服務資源，並將工作負載散發給這些資源。 (在同一個區域中建立多個語音服務資源不會影響效能，因為所有資源都會由相同的後端叢集提供服務)。

下一節將描述調整配額的特定案例。

語音轉文字：增加即時語音轉文字並行請求限制

根據預設，同時即時語音轉換文字和語音翻譯的合併要求在基底模型中每個資源的數目限制為 100 個，而在自訂模型中每個自訂端點為 100 個。在標準定價層中，您可以增加此數量。提交要求前，請確定您已熟悉本文稍早所討論的內容，例如移轉節流的最佳作法。

附註

基底和自訂模型的並行要求限制需要分別進行調整。您可以擁有一個語音服務資源，該資源與許多自訂端點相關聯，這些端點裝載了許多自訂模型的部署。視需要個別要求每個自訂端點的限制調整。

增加並行要求限制不會直接影響您的成本。語音服務採用一種支付模式，您只需為實際使用的服務付費。此限制定義了服務可以擴展的最大範圍，一旦超過此範圍，系統便會開始限制您的請求。

您無法在 Azure 入口網站、命令列工具或 API 要求中看到並行要求限制參數的現有值。若要確認現有值，請建立 Azure 支援要求。

附註

語音容器不需要增加並行要求限制，因為容器只受限於所裝載硬體的 CPU。不過，語音容器確實有自己的容量限制，應考慮到這一點。如需詳細資訊，請參閱語音容器常見問題。

備妥所需的資訊

針對基底模型：
- 語音資源識別碼
- 區域
針對自訂模型：
- 區域
- 自訂端點識別碼

如何取得基底模型的資訊：

前往 Azure 入口網站。
選取您要增加並行要求限制的語音服務資源。
在 [資源管理] 群組中選取 [屬性]。
複製並儲存下列欄位的值：
- 資源識別碼
- 位置 (您的端點區域)

如何取得自訂模型的資訊：

前往 Speech Studio 入口網站。
如有必要，請登入，然後前往自訂語音。
選取您的專案後，前往 [部署]。
選取所需的端點。
複製並儲存下列欄位的值：
- 服務區域 (您的端點區域)
- 端點識別碼

建立並提交支援要求

針對您的資源開始增加並行要求限制，或在必要時提交支援要求以檢查目前的限制。方法如下：

請確定您有上一節所列的必要資訊。
前往 Azure 入口網站。
選取您要增加 (或檢查) 並行要求限制的語音服務資源。
在 [支援 + 疑難排解] 群組，選取 [新支援要求]。新視窗即會出現，其中會自動填入 Azure 訂用帳戶和 Azure 資源的相關資訊。
在摘要中，說明您想要的內容 (例如「增加語音轉換文字並行要求限制」)。
在 [問題類型] 中，選取 [配額或訂用帳戶問題]。
在 [問題子類型]中，選取其中一項：
- [增加配額或並行要求] 以提出增加要求。
- [驗證配額或使用量] 以檢查現有限制。
選取 [下一步：解決方案]。繼續進行建立要求的作業。
在 [詳細資料] 索引標籤的 [描述] 欄位中，輸入下列內容：
- 附註，指出要求內容與語音轉換文字配額有關。
- 選擇基底或自訂模型其中一項。
- 您先前收集的 Azure 資源資訊。
- 其他必要資訊。
在 [檢閱 + 建立] 索引標籤中，選取 [建立]。
請記下 Azure 入口網站通知中的支援要求編號。系統很快就會根據您的要求與您聯絡。

工作負載模式最佳做法的範例

以下是採用良好方法的一般範例。這只是一個範本，實際使用時可以視需要調整。

假設語音服務資源的並行要求限制設定為 300。從 20 個並行連線數啟動工作負載，並每隔 90-120 分鐘，增加 20 個並行連線數的負載。如果您收到太多回應碼 429，請控制服務回應，並實作回復 (降低負載) 的邏輯。然後，在一分鐘內重試增加負載，如果仍無法運作，請在兩分鐘內再試一次。請採用間隔時間 1-2-4-4 分鐘的模式。

一般而言，在進入生產環境之前，先測試工作負載和工作負載模式是個好主意。

文字轉換語音：增加並行要求限制

在標準定價層中，您可以增加此數量。提交要求前，請確定您已熟悉本文稍早所討論的內容，例如移轉節流的最佳作法。

增加並行要求限制不會直接影響您的成本。語音服務會使用付款模型，僅需就您使用的服務付費。此限制定義了服務可以擴展的最大範圍，一旦超過此範圍，系統便會開始限制您的請求。

您無法在 Azure 入口網站、命令列工具或 API 要求中看到並行要求限制參數的現有值。若要確認現有值，請建立 Azure 支援要求。

附註

語音容器不需要增加並行要求限制，因為容器只受限於所裝載硬體的 CPU。

備妥所需的資訊

若要建立新增請求，您需要提供您的資訊。

針對標準語音：
- 語音資源識別碼
- 區域
針對自訂語音：
- 部署區域
- 自訂端點識別碼

如何取得標準語音的資訊：

前往 Azure 入口網站。
選取您要增加並行要求限制的語音服務資源。
在 [資源管理] 群組中選取 [屬性]。
複製並儲存下列欄位的值：
- 資源識別碼
- 位置 (您的端點區域)

如何取得自訂語音的資訊：

前往 Speech Studio 入口網站。
如有必要，請登入，然後前往自訂語音。
選取您的專案後，前往部署模型。
選取所需的端點。
複製並儲存下列欄位的值：
- 服務區域 (您的端點區域)
- 端點識別碼

建立並提交支援要求

針對您的資源開始增加並行要求限制，或在必要時提交支援要求以檢查目前的限制。方法如下：

請確定您有上一節所列的必要資訊。
前往 Azure 入口網站。
選取您要增加 (或檢查) 並行要求限制的語音服務資源。
在 [支援 + 疑難排解] 群組，選取 [新支援要求]。新視窗即會出現，其中會自動填入 Azure 訂用帳戶和 Azure 資源的相關資訊。
在摘要中，說明您想要的內容 (例如「增加文字轉換語音字並行要求限制」)。
在 [問題類型] 中，選取 [配額或訂用帳戶問題]。
在 [問題子類型]中，選取其中一項：
- [增加配額或並行要求] 以提出增加要求。
- [驗證配額或使用量] 以檢查現有限制。
在建議的解決方案 索引標籤中，選取下一步。
在其他詳細資料 索引標籤上，填入所有必要項目。在詳細資料 欄位中，輸入下列資料：
- 附註，請求是關於文字轉語音配額。
- 選擇標準語音或自定義語音。
- 您先前收集的 Azure 資源資訊。
- 其他必要資訊。
在 [檢閱 + 建立] 索引標籤中，選取 [建立]。
請記下 Azure 入口網站通知中的支援要求編號。系統很快就會根據您的要求與您聯絡。

文字轉換語音虛擬人偶：增加新的連線限制

若要增加每分鐘文字轉換語音虛擬人偶的新連線限制，請連絡您的銷售代表，以使用下列資訊建立票證：

語音資源 URI
增加新限制的要求
增加的理由
增加的開始日期
增額截止日期
標準虛擬人偶或自定義虛擬人偶

分享方式：

語音服務配額和限制

配額和限制參考

每個資源的語音轉換文字配額和限制

即時語音轉換文字及語音翻譯

快速轉錄

批次轉譯

模型自訂

每個資源的文字轉換語音配額和限制

即時文字轉換語音

批次合成

自訂語音 - 專業

自訂語音 - 個人語音

批次文字轉換語音虛擬人偶

即時文字轉換語音虛擬人偶

音訊內容建立工具

每個資源的說話者辨識配額和限制

詳細說明、配額調整和最佳做法

在自動調整期間降低節流的一般最佳做法

語音轉文字：增加即時語音轉文字並行請求限制

備妥所需的資訊

建立並提交支援要求

工作負載模式最佳做法的範例

文字轉換語音：增加並行要求限制

備妥所需的資訊

建立並提交支援要求

文字轉換語音虛擬人偶：增加新的連線限制

意見反映

更多資源