你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

创建专业声音项目(预览)

神经网络定制声音的内容(如数据、模型、测试和终结点)将在 Speech Studio 中组织成项目。 每个项目特定于某个国家/地区和语言,以及要创建的声音所属的性别。 例如,对于呼叫中心的聊天机器人,可以创建使用美式英语的女性声音项目。

提示

在投资专业录音以创建更高质量的声音之前,可试用神经网络定制声音 (CNV) 精简版来演示和评估 CNV。

只需准备好几个音频文件和关联的听录内容即可开始。 查看神经网络定制声音是否支持你的语言区域

创建神经网络定制声音专业版项目

若要创建神经网络定制声音专业版,请执行以下步骤:

  1. 登录 Speech Studio

  2. 选择要使用的订阅和语音资源。

    重要

    神经网络定制声音训练目前仅在部分区域可用。 在受支持区域中训练声音模型后,可以根据需要将其复制到另一个区域中的语音资源。 有关详细信息,请参阅区域表中的脚注。

  3. 选择“定制声音”>“创建项目”。

  4. 选择“神经网络定制声音专业版”>“下一步”。

  5. 遵照向导中的说明创建项目。

按名称选择新项目,或选择“转到项目”。 你将在左侧面板中看到以下菜单项:“设置发音人”、“准备训练数据”、“训练模型”和“部署模型”。

后续步骤

专业声音项目包含发音人同意声明、训练数据集、声音模型和终结点。

每个项目特定于某个国家/地区和语言,以及要创建的声音所属的性别。 例如,对于呼叫中心的聊天机器人,可以创建使用美式英语的女性声音项目。

创建项目

若要创建专业语音项目,请使用自定义语音 API 的 Projects_Create 操作。 根据以下说明构造请求正文:

  • 将所需的 kind 属性设置为 ProfessionalVoice。 以后无法更改此类型。
  • (可选)设置项目说明的 description 属性。 之后可更改此项目说明。

使用 URI 发出 HTTP PUT 请求,如以下 Projects_Create 示例所示。

  • YourResourceKey 替换为语音资源密钥。
  • YourResourceRegion 替换为你所在的语音资源区域。
  • ProjectId 替换为所选的项目 ID。 该 ID 区分大小写,并且在语音资源中必须是唯一的。 该 ID 将在项目的 URI 中使用,并且以后无法更改。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2023-12-01-preview"

你应该会收到以下格式的响应正文:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

在后续 API 请求中使用项目 id添加发音人同意创建训练集

后续步骤