Compartilhar via


Coletar entradas do usuário

Com a versão da ação Reconhecimento de Automação de Chamadas dos Serviços de Comunicação do Azure, os desenvolvedores agora podem aprimorar os próprios aplicativos IVR ou de centro de contato para reconhecer a entrada do usuário. Um dos cenários mais comuns de reconhecimento é reproduzir uma mensagem para o usuário, o que solicita que ele forneça uma resposta que, em seguida, é reconhecida pelo aplicativo, que depois realiza uma ação correspondente. A entrada dos chamadores pode ser recebida de várias maneiras, que incluem DTMF (entrada do usuário por meio dos dígitos no dispositivo de chamada dele), fala ou uma combinação de DTMF e fala.

Reconhecimento de voz com conversão de fala em texto

A integração dos serviços de Comunicação do Azure com os serviços de IA do Azure permite que você, por meio da ação Reconhecer, analise o áudio em tempo real para transcrever a palavra falada em texto. A Microsoft utiliza um Modelo de Linguagem Universal pronto para uso como um modelo base treinado com os dados de propriedade da Microsoft e reflete a linguagem falada comumente usada. Esse modelo é pré-treinado com dialetos e fonética que representam vários domínios comuns. Para obter mais informações sobre idiomas compatíveis, consulte Idiomas e voz com suporte para o serviço de Fala.

DTMF

O reconhecimento de DTMF (multifrequência de tom duplo) é o processo de compreensão de tons/sons gerados por um telefone, quando um número é pressionado. O equipamento na extremidade de recebimento escuta o tom específico e o converte em comandos. Esses comandos geralmente sinalizam a intenção do usuário ao navegar em um menu em um cenário de IVR ou, em alguns casos, podem ser usados para capturar informações importantes que o usuário precisa fornecer por meio do teclado de telefone.

Eventos de DTMF e os tons associados

Evento Tom
0 Zero
1 Um
2 Dois
3 Três
4 Quatro
5 Cinco
6 Seis
7 Sete
8 Oito
9 Nove
A A
B B
C C
D D
* Asterisco
# Libra

Casos de uso comuns

A ação de reconhecimento pode ser usada por muitos motivos. Veja aqui alguns exemplos de como os desenvolvedores podem usar a ação de reconhecimento no aplicativo.

Melhorar o percurso do usuário com prompts de autoatendimento

  • Os usuários podem controlar a chamada – Ao habilitar o reconhecimento de entrada, você permite que o chamador navegue no menu de IVR e forneça informações que possam ser usadas para resolver a consulta.
  • Coletar informações do usuário – Ao habilitar o reconhecimento de entrada, o aplicativo pode coletar entradas dos chamadores. Isso pode incluir informações como números de conta, informações de cartão de crédito etc.
  • Transcrever a resposta do chamador – Com o reconhecimento de voz, você pode coletar a entrada do usuário, transcrever o áudio no texto e analisá-lo para executar uma ação comercial específica.

Interromper prompts de áudio

O usuário pode sair de um menu de IVR e falar com um agente humano – com a interrupção do DTMF, o aplicativo pode permitir que os usuários interrompam o fluxo do menu de IVR e conversem com um agente humano.

Arquitetura de exemplo para reunir entradas de usuário em uma chamada com o reconhecimento de voz

Diagrama mostrando a arquitetura de exemplo para a ação de reconhecimento de IA.

Arquitetura de exemplo para reunir entradas de usuário em uma chamada

Ação de reconhecimento

Limitações conhecidas

  • Não há suporte para DTMF em banda, use RFC 2833 DTMF.
  • Os prompts de texto de Conversão de Texto em Fala dão suporte a no máximo 400 caracteres. Se o prompt for maior do que isso, sugerimos o uso de SSML para ações de reprodução baseadas em Conversão de Texto em Fala.
  • Para cenários em que você excede o limite de cota do serviço de Fala, é possível solicitar o aumento desse limite seguindo as etapas descritas aqui.

Próximas etapas