Comparteix a través de


Recopilación de entradas de usuario

Con el lanzamiento de la acción de reconocimiento de automatización de llamadas de Azure Communication Services, los desarrolladores ahora pueden mejorar su IVR o las aplicaciones del centro de contactos para reconocer la entrada del usuario. Uno de los escenarios más comunes de reconocimiento es reproducir un mensaje para el usuario, que le pide que proporcione una respuesta que, a continuación, la aplicación reconozca, una vez reconocida la aplicación, realice una acción correspondiente. La entrada de los autores de llamadas se puede recibir de varias maneras, que incluyen DTMF (entrada de usuario a través de los dígitos en su dispositivo de llamada), voz o una combinación de DTMF y voz.

reconocimiento de voz con voz a texto

integración de los servicios de comunicaciones de Azure con los servicios de Azure AI, le permite a través de la acción Reconocer analizar el audio en tiempo real para transcribir palabras habladas en texto. Microsoft utiliza un modelo de lenguaje universal como modelo base entrenado con datos propiedad de Microsoft y refleja el lenguaje hablado usado habitualmente. Este modelo está entrenado previamente con dialectos y fonéticos que representan varios dominios comunes. Para obtener más información sobre los idiomas admitidos, vea Idiomas y compatibilidad con voz para el servicio voz.

DTMF

El reconocimiento multifrecuencia de tono dual (DTMF) es el proceso de comprensión de los tonos o sonidos generados por un teléfono cuando se presiona un número. El equipo en el extremo receptor escuchando el tono específico y, a continuación, los convierte en comandos. Por lo general, estos comandos indican la intención del usuario al navegar por un menú en un escenario de IVR o, en algunos casos, se puede usar para capturar información importante que el usuario necesita proporcionar a través del teclado de sus teléfonos.

Eventos DTMF y sus tonos asociados

Evento Tono
0 Cero
1 Uno
2 Dos
3 tres
4 Cuatro
5 Cinco
6 Seis
7 Siete
8 Ocho
9 Nueve
A A
B B
C C
D D
* Asterisco
# Pound

Casos de uso comunes

La acción de reconocimiento se puede usar por muchas razones; estos son algunos ejemplos de cómo los desarrolladores pueden usar la acción reconocer en su aplicación.

Mejora del recorrido del usuario con avisos de autoservicio

  • Los usuarios pueden controlar la llamada: habilitando el reconocimiento de entrada, permite al autor de la llamada navegar por el menú IVR y proporcionar información que se puede usar para resolver su consulta.
  • Recopilación de información de usuario: habilitando el reconocimiento de entrada, la aplicación puede recopilar la entrada de los autores de llamadas. Puede ser información como números de cuenta, información de tarjeta de crédito, etc.
  • Transcribe respuesta del autor de la llamada: Con el reconocimiento de voz, puede recopilar la entrada del usuario y transcribir el audio al texto y analizarlo para llevar a cabo una acción empresarial específica.

Interrumpir mensajes de audio

El usuario puede salir de un menú IVR y hablar con un agente humano: con la interrupción de DTMF, la aplicación puede permitir a los usuarios interrumpir el flujo del menú IVR y poder chatear con un agente humano.

Arquitectura de ejemplo para recopilar la entrada del usuario en una llamada con reconocimiento de voz

Diagrama en el que se muestra la arquitectura de muestra para Reconocer la acción de la IA.

Arquitectura de ejemplo para recopilar la entrada de usuario en una llamada

Reconocer acción

Limitación conocida

  • DTMF en banda no se admite, use RFC 2833 DTMF en su lugar.
  • Los mensajes de texto a voz admiten un máximo de 400 caracteres, si el mensaje es mayor se recomienda usar SSML para acciones de reproducción basadas en la conversión de texto a voz.
  • En escenarios en los que se supera el límite de cuota del servicio de voz, puede solicitar aumentar este limite siguiendo los pasos descritos aquí.

Pasos siguientes