分享方式:


文字轉換語音的個人版語音是什麽?

有了個人版語音,您可以讓使用者在幾秒鐘內取得 AI 對其語音產生的複寫。 使用口頭語句和簡短語音範例做為音訊提示,您可以為您的使用者建立個人語音,並讓他們以超過 100 個地區設定支援的任何 90 種語言產生語音。

注意

個人版語音可在以下區域使用:西歐、美國東部和東南亞。 如需支援的地區設定,請參閱 個人版語音語言支援

下表摘要說明個人版語音與專業版自訂神經語音之間的差異。

比較 個人版語音 專業版語音
目標案例 商務客戶要建置應用程式,以允許使用者在應用程式中建立和使用自己的個人版語音。 聊天機器人的品牌和角色聲音,或音訊內容閱讀等專業案例。
使用案例 限制為有限的使用案例。 請參閱 透明度資訊。 核准的客戶應該有一個計劃來支援超過 1,000 個個人版語音。 限制為有限的使用案例。 請參閱 透明度資訊
訓練資料 請確定您有遵循管理辦法。 使用自己的資料。 建議在專業工作室中錄製。
必要的資料大小 一分鐘的人類語音。 300-2000 個表達 (大約 30 分鐘到 3 小時的人類語音)。
定型時間 少於 5 秒 大約 20-40 個計算時數。
語音品質 自然對數 高度自然
多語言支援 是。 語音能夠說出大約 100 種語言,並啟用自動語言偵測。 是。 您必須選取「神經 – 交叉語言」功能,以定型會與定型資料說不同語言的模型。
可用性 Speech Studio 上的示範可在註冊後使用。 對 API 的存取僅限於合格的客戶和核准的使用案例。 透過輸入表單要求存取。 您只能在核准存取之後定型和部署 CNV 專業版模型。 CNV Pro 存取受限於資格和使用準則。 透過輸入表單要求存取。
定價 請參閱 此處1 的定價詳細資料。 請參閱 此處 的定價詳細資料。
負責任 AI 要求 需要説話者的語音配音員聲明。 不允許未經核准的使用案例。 需要説話者的語音配音員聲明。 不允許未經核准的使用案例。

1 請注意,只有提供此功能的服務區域才會顯示個人版語音定價,包括西歐、美國東部和東南亞。

試用示範

如果您有 S0 資源,您可以在 Speech Studio 中存取個人版語音示範。 若要使用個人版語音 API,您可以在這裡申請存取。

  1. 前往 Speech Studio

  2. 選取 [個人版語音] 卡片。

  3. 您可以錄製自己的語音,並嘗試不同語言的語音輸出樣本。 此示範包含個人版語音支援的語言子集。

    Speech Studio 中個人版語音示範體驗的螢幕擷取畫面。

如何建立個人版語音

若要開始使用,以下是建立個人版語音的步驟摘要:

  1. 建立專案
  2. 上傳同意檔案。 針對個人版語音功能,每個語音的建立都必須擁有使用者的明確同意。 需要使用者錄製的陳述式來確認客戶 (Azure AI 語音資源擁有者) 會建立及使用其語音。
  3. 取得個人版語音的說話者設定檔識別碼。 您會根據說話者的口頭同意聲明和音訊提示,取得說話者設定檔識別碼。 使用者的語音特性會編碼在用於文字轉換語音的 speakerProfileId 屬性中。

擁有個人版語音之後,您可以 使用它 來合成 100 多個地區設定支援的任何 91 種語言的語音。 不需要地區設定標籤。 個人版語音會在句子層級使用自動語言偵測。 如需詳細資訊,請參閱 在應用程式中使用個人版語音

提示

請查看 GitHub 上 語音 SDK 存放庫 中的程式碼範例,以了解如何在應用程式中使用個人版語音。

參考文件

負責 AI

我們關心技術,但我們也關心使用 AI 的人以及會受到其影響的人。 如需詳細資訊,請參閱 負責任 AI 透明度資訊

下一步