你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
配音员是个人或目标说话人,其语音会被录制下来并用于创建神经语音模型。
在微调专业语音之前,您必须提交配音演员同意声明的录音。 配音演员声明是他们阅读声明的录音,声明内容是他们同意使用语音数据进行专业语音优化。 同意声明还用于验证语音配音员是否与微调数据中的说话人相同。
提示
在 Azure AI Foundry 门户中开始之前,请定义声音角色并选择正确的发音人。
可在 GitHub 上找到多种语言的发音人同意声明。 口头陈述的语言必须与录制内容相同。 另请参阅针对发音人的披露内容。
添加发音人
提示
有关示例同意语句和训练数据,请参阅 GitHub 存储库。
若要添加发音人资料并上传其同意声明,请执行以下步骤:
从左窗格中选择 “微调 ”,然后选择 “AI 服务微调”。
选择你按创建专业声音一文所述启动的专业声音微调任务(按模型名称)。
选择 “设置配音员>+ 添加配音员”。
在 “添加新配音员 ”向导中,选择配音员的目标方案。 目标场景必须与申请表中提供的内容一致。 这些方案用于帮助识别语音人才,并确保为预期用例训练语音模型。
(可选)在 “语音特征 ”文本框中,输入要创建的语音特征的说明。
选择“下一步” 。
在 “上传口头陈述”页面,按照说明上传您事先录制的配音员声明。
- 输入发音人姓名和公司名称。 发音人姓名必须是录制同意声明的人员的姓名。 使用与录制的声明相同的语言输入名称。 公司名称必须与录制的声明中说出的公司名称匹配。 确保输入的公司名称与录制的声明使用相同的语言。
- 请务必采用微调数据时的设置、环境和说话风格来录制发音人声明。
选择“下一步” 。
查看配音员和角色详细信息,然后选择 “添加语音人才”。
发音人状态变为“成功”后,可以添加微调数据。
后续步骤
配音员是个人或目标说话人,其语音会被录制下来并用于创建神经语音模型。
在优化专业语音之前,必须提交语音人才同意声明的音频录音。 语音人才声明是指语音人才录制的一份声明,表明他们同意将其语音数据用于专业语音微调。 同意声明还用于验证语音配音员是否与微调数据中的说话人相同。
提示
在开始使用 Speech Studio 之前,请定义语音角色并选择合适的发音人。
可在 GitHub 上找到多种语言的发音人同意声明。 口头陈述的语言必须与录制内容相同。 另请参阅针对发音人的披露内容。
添加发音人
若要添加发音人资料并上传其同意声明,请执行以下步骤:
- 登录 Speech Studio。
- 选择“定制声音”“你的项目名称”>“设置发音人”>“添加发音人”>。
- 在“添加新的发音人”向导中,说明要创建的语音的特征。 在此处指定的方案必须符合你在申请表单中提供的内容。
- 选择“下一步” 。
- 在“上传发音人声明”页上,按照说明上传事先录制好的发音人声明。 请确保口头陈述是在与微调数据相同的设置、环境和说话风格下录制的。
- 输入发音人姓名和公司名称。 发音人姓名必须是录制同意声明的人员的姓名。 使用与录制的声明相同的语言输入名称。 公司名称必须与录制的声明中说出的公司名称匹配。 确保输入的公司名称与录制的声明使用相同的语言。
- 选择“下一步” 。
- 查看发音人和角色详细信息,然后选择“提交”。
发音人状态显示为“成功”后,即可继续训练自定义语音模型。
后续步骤
使用专业声音功能时,在创建每段语音之前都必须经得用户的明确同意。 需要用户提供录制的声明,确认客户(Azure AI 语音资源所有者)将创建并使用他们的声音。
要将发音人同意添加到专业声音项目中,可以从可公开访问的 URL (Consents_Create) 获取预先录制的同意音频文件或上传音频文件 (Consents_Post)。 在本文中,将从 URL 添加同意。
同意声明
你需要用户说出同意声明的录音。
可以从文本转语音 GitHub 存储库获取每个区域设置的同意声明文本。 有关 区域设置的同意声明,请参阅 en-US
:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
从 URL 添加同意
要从音频文件的 URL 添加对专业声音项目的同意,请使用定制声音 API 的 Consents_Create 操作。 根据以下说明构造请求正文:
- 设置所需的
projectId
属性。 请参阅创建项目。 - 设置所需的
voiceTalentName
属性。 发音人姓名必须是录制同意声明的人员的姓名。 使用与录制的声明相同的语言输入名称。 以后无法更改发音人姓名。 - 设置所需的
companyName
属性。 公司名称必须与录制的声明中说出的公司名称匹配。 确保输入的公司名称与录制的声明使用相同的语言。 以后无法更改公司名称。 - 设置所需的
audioUrl
属性。 发音人同意音频文件的 URL。 使用包含共享访问签名 (SAS) 令牌的 URI。 - 设置所需的
locale
属性。 这应是同意的区域设置。 以后无法更改此区域设置。 可在此处查找文本到语音区域设置列表。
使用 URI 发出 HTTP PUT 请求,如以下 Consents_Create 示例所示。
- 将
YourResourceKey
替换为语音资源密钥。 - 将
YourResourceRegion
替换为语音资源区域。 - 将
JessicaConsentId
替换为所选的同意 ID。 同意的 URI 中将使用区分大小写的 ID 并且此内容以后无法更改。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
你应该会收到以下格式的响应正文:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
响应头包含 Operation-Location
属性。 使用此 URI 获取有关 Consents_Create 操作的详细信息。 以下是响应头示例:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314