将语音转换为文本

已完成

使用 Azure AI 语音 SDK 的语音翻译的模式类似于语音识别,但其中添加了有关翻译的源语言和目标语言的信息:

A TranslationRecognizer object is created from a SpeechConfig, TranslationConfig, and AudioConfig; and its RecognizeOnceAsync method is used to call the Speech API.

  1. 使用 SpeechTranslationConfig 对象封装在连接到 Azure AI 语音资源时所需的信息。 具体来说,就是它的位置和键。

  2. SpeechTranslationConfig 对象还可用于指定语音识别语言(输入语音的源语言),以及应翻译成的目标语言。

  3. (可选)使用 AudioConfig 定义要转录的音频的输入源。 默认情况下,该输入源是系统默认麦克风,但你也可以指定音频文件。

  4. 使用 SpeechTranslationConfig 和 AudioConfig 创建 TranslationRecognizer 对象。 此对象是 Azure AI 语音翻译 API 的代理客户端。

  5. 使用 TranslationRecognizer 对象的方法调用基础 API 函数。 例如,RecognizeOnceAsync() 方法使用 Azure AI 语音服务以异步方式翻译单一口述言语。

  6. 处理来自 Azure AI 语音的响应。 对于 RecognizeOnceAsync() 方法,结果是一个 SpeechRecognitionResult 对象,它包含以下属性:

    • 持续时间
    • OffsetInTicks
    • 属性
    • 原因
    • ResultId
    • 文本
    • 翻译

如果操作成功,则 Reason 属性具有枚举值 RecognizedSpeechText 属性包含原始语言的听录。 还可以访问 Translations 属性,它包含翻译的字典(使用两个字符的 ISO 语言代码作为关键字,如“en”表示英语)。