Introducción

2 minutos

Azure AI Speech proporciona API que puede usar para compilar aplicaciones habilitadas para voz. Esto incluye:

Conversión de voz en texto: UNA API que permite el reconocimiento de voz en el que la aplicación puede aceptar la entrada hablada.
Texto a voz: UNA API que permite la síntesis de voz en la que la aplicación puede proporcionar una salida hablada.
Traducción de habla: una API que puede usar para traducir la entrada de voz en varios idiomas.
Reconocimiento de palabras clave: UNA API que permite a la aplicación reconocer palabras clave o frases cortas.
Reconocimiento de intenciones: UNA API que usa reconocimiento del lenguaje conversacional para determinar el significado semántico de la entrada hablada.

Este módulo se centra en el reconocimiento de voz y la síntesis de voz, que son funcionalidades principales de cualquier aplicación habilitada para voz.

En este módulo, aprenderá a:

Aprovisionamiento de un recurso de Azure para el servicio de Voz de Azure AI
Uso de speech to text API para implementar el reconocimiento de voz
Uso de la API Text-to-Speech para implementar la síntesis de voz
Configuración del formato de audio y las voces
Uso de Lenguaje de marcado de síntesis de voz (SSML)

Las unidades del módulo incluyen información conceptual importante sobre Azure AI Speech y cómo usar su API a través de uno de los kits de desarrollo de software (SDK) admitidos, después de lo cual podrá probar Azure AI Speech automáticamente en un ejercicio práctico. Para completar el ejercicio práctico, necesitará una suscripción de Microsoft Azure. Si aún no tiene una, puede solicitar una prueba gratuita en https://azure.com/free.

Introducción

Comentarios