文字轉換語音的個人版語音是什麽?

文章
07/05/2024

有了個人版語音，您可以讓使用者在幾秒鐘內取得 AI 對其語音產生的複寫。使用口頭語句和簡短語音範例做為音訊提示，您可以為您的使用者建立個人語音，並讓他們以超過 100 個地區設定支援的任何 90 種語言產生語音。

注意

個人版語音可在以下區域使用：西歐、美國東部和東南亞。如需支援的地區設定，請參閱個人版語音語言支援。

下表摘要說明個人版語音與專業版自訂神經語音之間的差異。

比較	個人版語音	專業版語音
目標案例	商務客戶要建置應用程式，以允許使用者在應用程式中建立和使用自己的個人版語音。	聊天機器人的品牌和角色聲音，或音訊內容閱讀等專業案例。
使用案例	限制為有限的使用案例。請參閱透明度資訊。核准的客戶應該有一個計劃來支援超過 1,000 個個人版語音。	限制為有限的使用案例。請參閱透明度資訊。
訓練資料	請確定您有遵循管理辦法。	使用自己的資料。建議在專業工作室中錄製。
必要的資料大小	一分鐘的人類語音。	300-2000 個表達 (大約 30 分鐘到 3 小時的人類語音)。
定型時間	少於 5 秒	大約 20-40 個計算時數。
語音品質	自然對數	高度自然
多語言支援	是。語音能夠說出大約 100 種語言，並啟用自動語言偵測。	是。您必須選取「神經 – 交叉語言」功能，以定型會與定型資料說不同語言的模型。
可用性	Speech Studio 上的示範可在註冊後使用。對 API 的存取僅限於合格的客戶和核准的使用案例。透過輸入表單要求存取。	您只能在核准存取之後定型和部署 CNV 專業版模型。 CNV Pro 存取受限於資格和使用準則。透過輸入表單要求存取。
定價	請參閱此處¹ 的定價詳細資料。	請參閱此處的定價詳細資料。
負責任 AI 要求	需要説話者的語音配音員聲明。不允許未經核准的使用案例。	需要説話者的語音配音員聲明。不允許未經核准的使用案例。

¹ 請注意，只有提供此功能的服務區域才會顯示個人版語音定價，包括西歐、美國東部和東南亞。

試用示範

如果您有 S0 資源，您可以在 Speech Studio 中存取個人版語音示範。若要使用個人版語音 API，您可以在這裡申請存取。

前往 Speech Studio
選取 [個人版語音] 卡片。
您可以錄製自己的語音，並嘗試不同語言的語音輸出樣本。此示範包含個人版語音支援的語言子集。

如何建立個人版語音

若要開始使用，以下是建立個人版語音的步驟摘要：

建立專案。
上傳同意檔案。針對個人版語音功能，每個語音的建立都必須擁有使用者的明確同意。需要使用者錄製的陳述式來確認客戶 (Azure AI 語音資源擁有者) 會建立及使用其語音。
取得個人版語音的說話者設定檔識別碼。您會根據說話者的口頭同意聲明和音訊提示，取得說話者設定檔識別碼。使用者的語音特性會編碼在用於文字轉換語音的 speakerProfileId 屬性中。

擁有個人版語音之後，您可以使用它來合成 100 多個地區設定支援的任何 91 種語言的語音。不需要地區設定標籤。個人版語音會在句子層級使用自動語言偵測。如需詳細資訊，請參閱在應用程式中使用個人版語音。

提示

請查看 GitHub 上語音 SDK 存放庫中的程式碼範例，以了解如何在應用程式中使用個人版語音。

參考文件

自訂語音 REST API 參考文件 (英文)

負責 AI

我們關心技術，但我們也關心使用 AI 的人以及會受到其影響的人。如需詳細資訊，請參閱負責任 AI 透明度資訊。

下一步

建立專案。
在概觀中深入了解自訂神經語音。
在概觀中深入了解 Speech Studio。

分享方式：