使用文本到语音转换服务,生成的音频结尾有1秒左右的空白

方 一 0 信誉分
2024-09-21T12:56:52.2533333+00:00

关于标记的,我没有找到关于speed所属的标记,因为必须要选一个标记,所以我也只能随便选一个了。

Snipaste_2024-09-21_20-52-53

我使用示例也还是会有空白的:

Snipaste_2024-09-21_17-18-27

结尾还是会有空白:

Snipaste_2024-09-21_17-18-38

有什么参数可以控制吗?或者你们给我一个结尾不会有空白的示例代码?

Windows Server
Windows Server
支持企业级管理、数据存储、应用程序和通信的 Microsoft 服务器操作系统系列。
183 个问题
{count} 票

2 个答案

排序依据: 非常有帮助
  1. 方 一 0 信誉分
    2024-09-22T02:25:10.82+00:00

    有官方人员可以解答一下我的问题吗

    0 个注释 无注释

  2. 方 一 0 信誉分
    2024-09-22T05:10:53.0633333+00:00

    问题解决了。

    需要设置静音时长:

    <speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xml:lang="en-US">
    <voice name="zh-CN-henan-YundengNeural">
    <mstts:silence  type="Leading-exact" value="0ms"/>
    <mstts:silence  type="Leading" value="0ms"/>
    <break time="0ms" />
    <mstts:viseme type="FacialExpression"/>
    很高兴认识你,这是我们的音色效果演示
    <mstts:silence  type="Tailing-exact" value="0ms"/>
    <mstts:silence  type="Tailing" value="0ms"/>
    <break time="0ms" />
    <mstts:viseme type="FacialExpression"/>
    </voice>
    </speak>
    
    0 个注释 无注释

你的答案

问题作者可以将答案标记为“接受的答案”,这有助于用户了解已解决作者问题的答案。