Introducción

Completado

Azure AI Speech proporciona API que puede usar para compilar aplicaciones habilitadas para voz. Esto incluye:

  • Conversión de voz en texto: UNA API que permite el reconocimiento de voz en el que la aplicación puede aceptar la entrada hablada.
  • Texto a voz: UNA API que permite la síntesis de voz en la que la aplicación puede proporcionar una salida hablada.
  • Traducción de habla: una API que puede usar para traducir la entrada de voz en varios idiomas.
  • Reconocimiento de palabras clave: UNA API que permite a la aplicación reconocer palabras clave o frases cortas.
  • Reconocimiento de intenciones: UNA API que usa reconocimiento del lenguaje conversacional para determinar el significado semántico de la entrada hablada.

Este módulo se centra en el reconocimiento de voz y la síntesis de voz, que son funcionalidades principales de cualquier aplicación habilitada para voz.

Nota:

Los ejemplos de código de este módulo se proporcionan en Python, pero puede usar cualquiera de los paquetes disponibles del SDK de Voz de Azure AI para desarrollar aplicaciones habilitadas para voz en su lenguaje preferido. Los paquetes de SDK disponibles incluyen: