將語音人才同意新增至專業語音專案
語音人才是一個個人或目標說話者,其聲音會錄製並用來建立神經語音模型。
在定型神經語音之前,您必須先提交語音人才同意聲明的錄製。 語音人才聲明是語音人才的錄音,其讀取語句同意使用語音數據來定型自定義語音模型。 同意聲明也用來驗證語音人才與訓練數據中的說話者相同。
提示
在開始使用Speech Studio之前,請先定義您的語音 角色,然後選擇正確的語音人才。
您可以在 GitHub 上找到多種語言的口頭同意聲明。 口頭陳述的語言必須與錄製相同。 另請參閱語音人才的披露。
新增語音人才
若要新增語音人才配置檔並上傳其同意聲明,請遵循下列步驟:
- 登入 Speech Studio。
- 選取 [自定義語音> 您的項目名稱>][設定語音人才>][新增語音人才]。
- 在 [新增語音人才精靈] 中,描述您要建立之語音的特性。 您在此處指定的案例必須與您在應用程式表單中提供的內容一致。
- 選取 [下一步]。
- 在 [ 上傳語音人才陳述 ] 頁面上,遵循指示來上傳您事先錄製的語音人才聲明。 請確定已使用與訓練數據相同的設定、環境和說話樣式來記錄口頭語句。
- 輸入語音人才名稱和公司名稱。 語音人才名稱必須是錄製同意聲明的人員名稱。 公司名稱必須符合記錄的語句中所說的公司名稱。
- 選取 [下一步]。
- 檢閱語音人才和角色詳細數據,然後選取 [ 提交]。
語音人才狀態 成功之後,您可以繼續 訓練自定義語音模型。
下一步
使用專業語音功能時,必須以用戶明確同意建立每個語音。 用戶必須確認客戶 (Azure AI 語音資源擁有者) 會建立及使用其語音,因此需要用戶錄製的語句。
若要將語音人才同意新增至專業語音專案,您可以從可公開存取的 URL 取得預先錄製的同意音訊檔案(Consents_Create),或上傳音訊檔案(Consents_Post)。 在本文中,您會從 URL 新增同意。
同意聲明
您需要使用者說話同意聲明的音訊錄製。
您可以從文字到語音 GitHub 存放庫取得每個地區設定的同意語句文字。 如需地區設定的同意聲明en-US
,請參閱SpeakerAuthorization.txt:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
從 URL 新增同意
若要從音訊檔案的 URL 新增對專業語音專案的同意,請使用 自定義語音 API 的Consents_Create 作業。 根據下列指示建構要求本文:
- 設定必要的
projectId
屬性。 請參閱 建立專案。 - 設定必要的
voiceTalentName
屬性。 配音人才名稱稍後無法變更。 - 設定必要的
companyName
屬性。 公司名稱稍後無法變更。 - 設定必要的
audioUrl
屬性。 語音人才同意音訊檔案的URL。 使用 URI 搭配 共用存取簽章 (SAS) 令牌。 - 設定必要的
locale
屬性。 這應該是同意的地區設定。 地區設定稍後無法變更。 您可以在這裡找到文字到語音轉換的地區設定清單。
使用 URI 提出 HTTP PUT 要求,如下列 Consents_Create 範例所示。
- 將取代
YourResourceKey
為您的語音資源金鑰。 - 將取代
YourResourceRegion
為您的語音資源區域。 - 以您選擇的同意識別碼取代
JessicaConsentId
。 區分大小寫的標識碼將會用於同意的 URI 中,且稍後無法變更。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2023-12-01-preview"
您應該收到下列格式的回應本文:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
響應標頭包含 Operation-Location
屬性。 使用此 URI 來取得Consents_Create作業的詳細數據。 以下是回應標頭的範例:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2023-12-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314