Introducción

Completado

Las funcionalidades de voz de IA nos permiten administrar sistemas domésticos y automáticos con instrucciones de voz, obtener respuestas de ordenadores para preguntas orales, generar subtítulos a partir de audio y mucho más.

Para habilitar este tipo de interacción, el sistema de IA debe admitir dos funciones:

  • Reconocimiento de voz: capacidad de detectar e interpretar la entrada hablada
  • Síntesis de voz: capacidad de generar salidas verbales

Voz de Azure AI proporciona funcionalidades de conversión de voz en texto y texto a voz a través del reconocimiento de voz y la síntesis. Puede usar modelos de servicio de voz precompilados y personalizados para una variedad de tareas, como transcribir audio a texto con alta precisión, identificar hablantes en conversaciones, crear voces personalizadas, etc. A continuación, aprenderá cómo operan las funcionalidades de voz de IA.