Share via


將語音人才同意新增至專業語音專案

語音人才是一個個人或目標說話者,其聲音會錄製並用來建立神經語音模型。

在定型神經語音之前,您必須先提交語音人才同意聲明的錄製。 語音人才聲明是語音人才的錄音,其讀取語句同意使用語音數據來定型自定義語音模型。 同意聲明也用來驗證語音人才與訓練數據中的說話者相同。

提示

在開始使用Speech Studio之前,請先定義您的語音 角色,然後選擇正確的語音人才

您可以在 GitHub找到多種語言的口頭同意聲明。 口頭陳述的語言必須與錄製相同。 另請參閱語音人才披露。

新增語音人才

若要新增語音人才配置檔並上傳其同意聲明,請遵循下列步驟:

  1. 登入 Speech Studio
  2. 選取 [自定義語音> 您的項目名稱>][設定語音人才>][新增語音人才]。
  3. 在 [新增語音人才精靈] 中,描述您要建立之語音的特性。 您在此處指定的案例必須與您在應用程式表單中提供的內容一致。
  4. 選取 [下一步]。
  5. 在 [ 上傳語音人才陳述 ] 頁面上,遵循指示來上傳您事先錄製的語音人才聲明。 請確定已使用與訓練數據相同的設定、環境和說話樣式來記錄口頭語句Screenshot of the voice talent statement upload dialog.
  6. 輸入語音人才名稱和公司名稱。 語音人才名稱必須是錄製同意聲明的人員名稱。 公司名稱必須符合記錄的語句中所說的公司名稱。
  7. 選取 [下一步]。
  8. 檢閱語音人才和角色詳細數據,然後選取 [ 提交]。

語音人才狀態 成功之後,您可以繼續 訓練自定義語音模型

下一步

使用專業語音功能時,必須以用戶明確同意建立每個語音。 用戶必須確認客戶 (Azure AI 語音資源擁有者) 會建立及使用其語音,因此需要用戶錄製的語句。

若要將語音人才同意新增至專業語音專案,您可以從可公開存取的 URL 取得預先錄製的同意音訊檔案(Consents_Create),或上傳音訊檔案(Consents_Post)。 在本文中,您會從 URL 新增同意。

您需要使用者說話同意聲明的音訊錄製。

您可以從文字到語音 GitHub 存放庫取得每個地區設定的同意語句文字。 如需地區設定的同意聲明en-US,請參閱SpeakerAuthorization.txt

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

若要從音訊檔案的 URL 新增對專業語音專案的同意,請使用 自定義語音 API 的Consents_Create 作業。 根據下列指示建構要求本文:

  • 設定必要的 projectId 屬性。 請參閱 建立專案
  • 設定必要的 voiceTalentName 屬性。 配音人才名稱稍後無法變更。
  • 設定必要的 companyName 屬性。 公司名稱稍後無法變更。
  • 設定必要的 audioUrl 屬性。 語音人才同意音訊檔案的URL。 使用 URI 搭配 共用存取簽章 (SAS) 令牌。
  • 設定必要的 locale 屬性。 這應該是同意的地區設定。 地區設定稍後無法變更。 您可以在這裡找到文字到語音轉換的地區設定清單

使用 URI 提出 HTTP PUT 要求,如下列 Consents_Create 範例所示。

  • 將取代 YourResourceKey 為您的語音資源金鑰。
  • 將取代 YourResourceRegion 為您的語音資源區域。
  • 以您選擇的同意識別碼取代 JessicaConsentId 。 區分大小寫的標識碼將會用於同意的 URI 中,且稍後無法變更。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2023-12-01-preview"

您應該收到下列格式的回應本文:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

響應標頭包含 Operation-Location 屬性。 使用此 URI 來取得Consents_Create作業的詳細數據。 以下是回應標頭的範例:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2023-12-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

下一步