向专业声音项目添加发音人同意

你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

2025-06-05

配音员是个人或目标说话人，其语音会被录制下来并用于创建神经语音模型。

在微调专业语音之前，您必须提交配音演员同意声明的录音。配音演员声明是他们阅读声明的录音，声明内容是他们同意使用语音数据进行专业语音优化。同意声明还用于验证语音配音员是否与微调数据中的说话人相同。

提示

在 Azure AI Foundry 门户中开始之前，请定义声音角色并选择正确的发音人。

可在 GitHub 上找到多种语言的发音人同意声明。口头陈述的语言必须与录制内容相同。另请参阅针对发音人的披露内容。

添加发音人

提示

有关示例同意语句和训练数据，请参阅 GitHub 存储库。

若要添加发音人资料并上传其同意声明，请执行以下步骤：

登录 Azure AI Foundry 门户。
从左窗格中选择 “微调 ”，然后选择 “AI 服务微调”。
选择你按创建专业声音一文所述启动的专业声音微调任务（按模型名称）。
选择 “设置配音员>+ 添加配音员”。
在 “添加新配音员 ”向导中，选择配音员的目标方案。目标场景必须与申请表中提供的内容一致。这些方案用于帮助识别语音人才，并确保为预期用例训练语音模型。
（可选）在 “语音特征 ”文本框中，输入要创建的语音特征的说明。
选择“下一步” 。
在 “上传口头陈述”页面，按照说明上传您事先录制的配音员声明。
- 输入发音人姓名和公司名称。发音人姓名必须是录制同意声明的人员的姓名。使用与录制的声明相同的语言输入名称。公司名称必须与录制的声明中说出的公司名称匹配。确保输入的公司名称与录制的声明使用相同的语言。
- 请务必采用微调数据时的设置、环境和说话风格来录制发音人声明。
选择“下一步” 。
查看配音员和角色详细信息，然后选择 “添加语音人才”。

发音人状态变为“成功”后，可以添加微调数据。

后续步骤

为专业语音微调添加训练数据

配音员是个人或目标说话人，其语音会被录制下来并用于创建神经语音模型。

在优化专业语音之前，必须提交语音人才同意声明的音频录音。语音人才声明是指语音人才录制的一份声明，表明他们同意将其语音数据用于专业语音微调。同意声明还用于验证语音配音员是否与微调数据中的说话人相同。

提示

在开始使用 Speech Studio 之前，请定义语音角色并选择合适的发音人。

可在 GitHub 上找到多种语言的发音人同意声明。口头陈述的语言必须与录制内容相同。另请参阅针对发音人的披露内容。

添加发音人

若要添加发音人资料并上传其同意声明，请执行以下步骤：

登录 Speech Studio。
选择“定制声音”“你的项目名称”>“设置发音人”>“添加发音人”>。
在“添加新的发音人”向导中，说明要创建的语音的特征。在此处指定的方案必须符合你在申请表单中提供的内容。
选择“下一步” 。
在“上传发音人声明”页上，按照说明上传事先录制好的发音人声明。请确保口头陈述是在与微调数据相同的设置、环境和说话风格下录制的。
输入发音人姓名和公司名称。发音人姓名必须是录制同意声明的人员的姓名。使用与录制的声明相同的语言输入名称。公司名称必须与录制的声明中说出的公司名称匹配。确保输入的公司名称与录制的声明使用相同的语言。
选择“下一步” 。
查看发音人和角色详细信息，然后选择“提交”。

发音人状态显示为“成功”后，即可继续训练自定义语音模型。

后续步骤

向专业语音项目添加训练数据

使用专业声音功能时，在创建每段语音之前都必须经得用户的明确同意。需要用户提供录制的声明，确认客户（Azure AI 语音资源所有者）将创建并使用他们的声音。

要将发音人同意添加到专业声音项目中，可以从可公开访问的 URL (Consents_Create) 获取预先录制的同意音频文件或上传音频文件 (Consents_Post)。在本文中，将从 URL 添加同意。

你需要用户说出同意声明的录音。

可以从文本转语音 GitHub 存储库获取每个区域设置的同意声明文本。有关区域设置的同意声明，请参阅 en-US：

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

要从音频文件的 URL 添加对专业声音项目的同意，请使用定制声音 API 的 Consents_Create 操作。根据以下说明构造请求正文：

设置所需的 projectId 属性。请参阅创建项目。
设置所需的 voiceTalentName 属性。发音人姓名必须是录制同意声明的人员的姓名。使用与录制的声明相同的语言输入名称。以后无法更改发音人姓名。
设置所需的 companyName 属性。公司名称必须与录制的声明中说出的公司名称匹配。确保输入的公司名称与录制的声明使用相同的语言。以后无法更改公司名称。
设置所需的 audioUrl 属性。发音人同意音频文件的 URL。使用包含共享访问签名 (SAS) 令牌的 URI。
设置所需的 locale 属性。这应是同意的区域设置。以后无法更改此区域设置。可在此处查找文本到语音区域设置列表。

使用 URI 发出 HTTP PUT 请求，如以下 Consents_Create 示例所示。

将 YourResourceKey 替换为语音资源密钥。
将 YourResourceRegion 替换为语音资源区域。
将 JessicaConsentId 替换为所选的同意 ID。同意的 URI 中将使用区分大小写的 ID 并且此内容以后无法更改。

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

你应该会收到以下格式的响应正文：

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

响应头包含 Operation-Location 属性。使用此 URI 获取有关 Consents_Create 操作的详细信息。以下是响应头示例：

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

后续步骤

向专业语音项目添加训练数据

通过

添加发音人

后续步骤

添加发音人

后续步骤

同意声明

从 URL 添加同意

后续步骤

反馈

其他资源