語音服務配額和限制
本文包含快速參考,以及 Azure AI 服務中語音服務的配額和限制的詳細描述。 此資訊適用於服務的所有 定價層 。 其也包含一些避免要求節流的最佳做法。
如需免費 (F0) 定價層,請參閱定價頁面的每月津貼。
配額和限制參考
下列各節提供您適用於語音服務的配額和限制的快速指南。
如需標準 (S0) 語音資源可調整配額的相關信息,請參閱 更多說明、 最佳做法和 調整指示。 免費 (F0) 語音資源的配額和限制無法調整。
重要
如果您將語音資源從免費 (F0) 切換至標準 (S0) 定價層,對應的配額變更最多可能需要數小時的時間。
每個資源的語音轉換文字配額和限制
本節說明每個語音資源的語音轉換文字配額和限制。 除非另有指定,否則無法調整限制。
即時語音轉換文字和語音翻譯
您可以使用即時語音轉換文字搭配 語音 SDK 或 語音轉換文字 REST API 來取得簡短音訊。
重要
這些限制適用於同時對文字要求和語音翻譯要求合併的即時語音。 例如,如果您有 60 個並行語音到文字要求和 40 個並行語音翻譯要求,您將達到 100 個並行要求的限制。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
並行要求限制 - 基底模型端點 | 1 此限制無法調整。 |
100 (預設值) 標準 (S0) 資源可調整速率。 請參閱 更多說明、 最佳做法和 調整指示。 |
並行要求限制 - 自定義端點 | 1 此限制無法調整。 |
100 (預設值) 標準 (S0) 資源可調整速率。 請參閱 更多說明、 最佳做法和 調整指示。 |
即時 diarization 的音訊長度上限。 | N/A | 每個檔案 240 分鐘 |
批次轉譯
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
語音轉換文字 REST API 限制 | F0 無法使用 | 每 10 秒 100 個要求 (每分鐘 600 個要求) |
音訊輸入檔案大小上限 | N/A | 1 GB |
每個容器的 Blob 數目上限 | N/A | 10000 |
每個轉譯要求的最大檔案數目(當您使用多個內容 URL 作為輸入時)。 | N/A | 1000 |
啟用聽寫的音訊長度上限。 | N/A | 每個檔案 240 分鐘 |
模型自訂
當您建立自定義語音模型時,此表格中的限制適用於每個語音資源。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
REST API 限制 | 每 10 秒 100 個要求 (每分鐘 600 個要求) | 每 10 秒 100 個要求 (每分鐘 600 個要求) |
語音數據集數目上限 | 2 | 500 |
數據匯入的原音數據集檔案大小上限 | 2 GB | 2 GB |
數據匯入的語言數據集檔案大小上限 | 200 MB | 1.5 GB |
數據匯入的發音數據集檔案大小上限 | 1 KB | 1 MB |
當您在 text Models_Create API 要求中使用 參數時,文字大小上限 |
200 KB | 500 KB |
每個資源的文字到語音轉換配額和限制
本節說明每個語音資源的語音轉換配額和限制文字。
即時文字到語音轉換
您可以使用即時文字搭配語音 SDK 或文字到語音轉換 REST API 來語音轉換。 除非另有指定,否則無法調整限制。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
預先建置神經語音和自定義神經語音的每個時間週期交易數目上限。 | 每 60 秒 20 筆交易 此限制無法調整。 |
每秒 200 筆交易 (TPS) (預設值) 標準 (S0) 資源的速率可調整至 1000 TPS。 請參閱 更多說明、 最佳做法和 調整指示。 |
每個要求所產生的音訊長度上限 | 10 分鐘 | 10 分鐘 |
SSML 中相異 <voice> 和 <audio> 標記的總數上限 |
50 | 50 |
Websocket 每個回合的 SSML 訊息大小上限 | 64 KB | 64 KB |
批次合成
這些限制無法調整。 如需批次合成延遲的詳細資訊,請參閱 批次合成延遲和最佳做法。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
REST API 限制 | F0 無法使用 | 每10秒100個要求 |
建立合成作業的 JSON 承載大小上限 | N/A | 2 MB |
並行作用中合成作業 | N/A | 無限制 |
每個合成作業的文字輸入數目上限 | N/A | 10000 |
合成工作存留時間上限,因為它處於最終狀態 | N/A | 最多 31 天(使用屬性指定) |
自定義神經語音 - 專業
當您建立專業自定義神經語音模型時,此表格中的限制適用於每個語音資源。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
每秒交易數目上限 (TPS) | F0 無法使用 | 每秒 200 筆交易 (TPS) (預設值) |
數據集數目上限 | N/A | 500 |
同時上傳數據集的數目上限 | N/A | 5 |
每個數據集的數據匯入數據檔大小上限 | N/A | 2 GB |
上傳不含腳本的長音訊或音訊 | N/A | Yes |
同時模型定型的數目上限 | N/A | 4 |
自定義端點數目上限 | N/A | 50 |
自定義神經語音 - 個人語音
當您建立個人語音時,此表格中的限制適用於每個語音資源。
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
REST API 限制(不包括語音合成) | F0 無法使用 | 每10秒50個要求 |
語音合成每秒交易數上限 (TPS) | F0 無法使用 | 每秒 200 筆交易 (TPS) (預設值) |
批次文字到語音虛擬人偶
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
REST API 限制 | F0 無法使用 | 每 1 分鐘 2 個要求 |
即時文字到語音虛擬人偶
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
每分鐘的新聯機數 | F0 無法使用 | 每分鐘 2 個新連線 |
音訊內容建立工具
配額 | 免費 (F0) | 標準 (S0) |
---|---|---|
檔案大小 (SSML 中的純文字)1 | 每個檔案 3,000 個字元 | 每個檔案 20,000 個字元 |
檔案大小 (詞典檔案)2 | 每個檔案 30KB | 每個檔案 100KB |
SSML 中的可計費字元 | 每個檔案 15,000 個字元 | 每個檔案 100,000 個字元 |
匯出至音訊庫 | 1 個並行工作 | N/A |
1 限制僅適用於 SSML 中的純文字,且不包含標籤。
2 語彙檔案的字元不會收費。 只有 SSML 中的語彙項目會計算為可計費字元。 若要 深入瞭解,請參閱可計費字元 。
說話者辨識配額和每個資源的限制
說話者辨識限制為每秒 20 筆交易(TPS)。
詳細描述、配額調整和最佳做法
某些語音服務配額是可調整的。 本節提供更多說明、最佳做法和調整指示。
標準 (S0) 資源可調整下列配額。 免費 (F0) 要求限制無法調整。
在要求增加配額 (如果適用) 之前,請確定有必要。 語音服務會使用自動調整技術,以隨選模式引進所需的計算資源。 同時,語音服務會嘗試藉由不維持過多的硬體容量來降低成本。
讓我們看看下列範例。 假設您的應用程式收到回應碼 429,表示要求太多。 即使您的工作負載位於配額和限制參考所定義的限制內,您的應用程式仍會收到此回應。 最可能的解釋是語音服務會相應增加至您的需求,但尚未達到所需的縮放比例。 因此,服務不會立即有足夠的資源來提供服務要求。 在大部分情況下,此節流狀態是暫時性的。
在自動調整期間降低節流的一般最佳做法
若要將與節流相關的問題降到最低,最好使用下列技術:
- 在您的應用程式中實作重試邏輯。
- 避免工作負載急遽變化。 逐漸增加工作負載。 例如,假設您的應用程式使用文字到語音轉換,而您目前的工作負載是 5 TPS。 下一秒,您會將負載增加到 20 TPS(也就是增加 4 倍)。 語音服務會立即開始相應增加以完成新的負載,但無法視需要在一秒內進行調整。 某些要求會取得回應碼 429 (要求太多)。
- 測試不同的負載增加模式。 如需詳細資訊,請參閱 工作負載模式範例。
- 在不同的區域中建立更多語音服務資源,並在其中分散工作負載。 (在相同區域中建立多個語音服務資源不會影響效能,因為所有資源都由相同的後端叢集提供服務)。
下一節將描述調整配額的特定案例。
語音轉換文字:將實時語音提升為文字並行要求限制
根據預設,合併的並行即時語音轉換文字和語音翻譯要求數目限制為基底模型中每個資源的100個,而自定義模型中的每個自定義端點則限制為100個。 針對標準定價層,您可以增加此金額。 提交要求之前,請確定您已熟悉本文稍早討論的材料,例如緩和節流的最佳作法。
注意
必須個別調整基底和自定義模型的並行要求限制。 您可以擁有與裝載許多自訂模型部署之許多自定義端點相關聯的語音服務資源。 視需要,必須個別要求每個自定義端點的限制調整。
增加並行要求的限制並不會影響您的成本。 語音服務會使用付款模型,要求您只支付所使用的費用。 此限制會定義服務在啟動對要求進行節流之前可調整的級別。
您無法在 Azure 入口網站、命令行工具或 API 要求中看到並行要求限制參數的現有值。 若要確認現有的值,請建立 Azure 支援 要求。
備妥所需的資訊
- 針對基底模型:
- 語音資源標識碼
- 區域
- 針對自訂模型:
- 區域
- 自定義端點標識碼
如何取得基底模型的資訊:
- 前往 Azure 入口網站。
- 選取您想要增加並行要求限制的語音服務資源。
- 從 [ 資源管理] 群組中,選取 [ 屬性]。
- 複製並儲存下列欄位的值:
- 資源識別碼
- 位置 (您的端點區域)
如何取得自訂模型的資訊:
- 移至 Speech Studio 入口網站。
- 視需要登入,然後移至 [自定義語音]。
- 選取您的項目,然後移至 [ 部署]。
- 選取必要的端點。
- 複製並儲存下列欄位的值:
- 服務區域 (您的端點區域)
- 端點標識碼
建立並提交支援要求
藉由提交支援要求,起始資源並行要求的限制增加,或在必要時檢查目前的限制。 方法如下:
- 請確定您有上一節所列的必要資訊。
- 前往 Azure 入口網站。
- 選取您想要增加的語音服務資源(或檢查)並行要求限制。
- 在 [ 支援 + 疑難解答] 群組中,選取 [ 新增支援要求]。 隨即會出現新的視窗,其中包含 Azure 訂用帳戶和 Azure 資源的相關自動填入資訊。
- 在 [摘要] 中,描述您想要的內容(例如「增加語音轉文字並行要求限制」)。
- 在 [問題類型] 中,選取 [配額] 或 [ 訂用帳戶問題]。
- 在 [問題] 子類型中,選取下列其中一項:
- 增加要求的配額或並行要求增加 。
- 要檢查現有限制的配額或使用量驗證 。
- 選取 [下一步:解決方案]。 繼續進行建立要求的作業。
- 在 [詳細數據] 索引標籤的 [描述] 欄位中,輸入下列專案:
- 請注意,要求與語音轉換文字配額有關。
- 選擇基底或自定義模型。
- 您 先前收集的 Azure 資源資訊。
- 任何其他必要資訊。
- 在 [檢閱 + 建立] 索引標籤中,選取 [建立]。
- 請記下 Azure 入口網站通知中的支援要求編號。 您很快就會連絡您的要求。
工作負載模式最佳做法的範例
以下是採用良好方法的一般範例。 它只是作為範本,您可以視需要進行調整,以供自己使用。
假設語音服務資源已將並行要求限制設定為 300。 從 20 個並行連線啟動工作負載,每 90-120 秒增加 20 個並行連線。 控制服務回應,並在收到太多要求(回應碼 429)時實作回溯(減少負載)的邏輯。 然後,請在一分鐘內重試負載增加,如果仍然無法運作,請在兩分鐘內再試一次。 針對間隔使用 1-2-4-4 分鐘模式。
一般而言,最好先測試工作負載和工作負載模式,再進入生產環境。
文字到語音轉換:增加並行要求限制
針對標準定價層,您可以增加此金額。 提交要求之前,請確定您已熟悉本文稍早討論的材料,例如緩和節流的最佳作法。
增加並行要求的限制並不會影響您的成本。 語音服務會使用付款模型,要求您只支付您所使用的費用。 此限制會定義服務在啟動對要求進行節流之前可調整的級別。
您無法在 Azure 入口網站、命令行工具或 API 要求中看到並行要求限制參數的現有值。 若要確認現有的值,請建立 Azure 支援 要求。
注意
語音容器 不需要增加並行要求限制,因為容器只會受限於裝載硬體的CPU。
準備必要資訊
若要建立增加要求,您必須提供資訊。
- 針對預先建置的語音:
- 語音資源標識碼
- 區域
- 針對自訂語音:
- 部署區域
- 自定義端點標識碼
如何取得預先建置語音的資訊:
- 前往 Azure 入口網站。
- 選取您想要增加並行要求限制的語音服務資源。
- 從 [ 資源管理] 群組中,選取 [ 屬性]。
- 複製並儲存下列欄位的值:
- 資源識別碼
- 位置 (您的端點區域)
如何取得自訂語音的資訊:
- 移至 Speech Studio 入口網站。
- 如有必要,請登入,然後移至 [自定義語音]。
- 選取您的項目,然後移至 [ 部署模型]。
- 選取必要的端點。
- 複製並儲存下列欄位的值:
- 服務區域 (您的端點區域)
- 端點標識碼
建立並提交支援要求
藉由提交支援要求,起始資源並行要求的限制增加,或在必要時檢查目前的限制。 方法如下:
- 請確定您有上一節所列的必要資訊。
- 前往 Azure 入口網站。
- 選取您想要增加的語音服務資源(或檢查)並行要求限制。
- 在 [ 支援 + 疑難解答] 群組中,選取 [ 新增支援要求]。 隨即會出現新的視窗,其中包含 Azure 訂用帳戶和 Azure 資源的相關自動填入資訊。
- 在 [摘要] 中,描述您想要的內容(例如「增加文字到語音並行要求限制」)。
- 在 [問題類型] 中,選取 [配額] 或 [ 訂用帳戶問題]。
- 在 [問題] 子類型中,選取下列其中一項:
- 增加要求的配額或並行要求增加 。
- 要檢查現有限制的配額或使用量驗證 。
- 在 [ 建議的解決方案] 索引標籤上,選取 [ 下一步]。
- 在 [ 其他詳細數據] 索引標籤上,填入所有必要的專案。 在 [ 詳細數據] 欄位中,輸入下列專案:
- 請注意,要求與文字到語音轉換配額有關。
- 選擇預先建置的語音或自定義語音。
- 您 先前收集的 Azure 資源資訊。
- 任何其他必要資訊。
- 在 [檢閱 + 建立] 索引標籤中,選取 [建立]。
- 請記下 Azure 入口網站通知中的支援要求編號。 您很快就會連絡您的要求。
文字到語音轉換虛擬人偶:增加新的連線限制
若要增加文字到語音虛擬人偶每分鐘的新連線限制,請連絡您的銷售代表,以使用下列資訊建立 票證 :
- 語音資源 URI
- 要求增加至 的新限制
- 增加的理由
- 增加的開始日期
- 增加的結束日期
- 預先建置的虛擬人偶或自定義虛擬人偶
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: