Gebruikersinvoer verzamelen

Met de release van azure Communication Services Call Automation Recognize-actie kunnen ontwikkelaars nu hun IVR- of contactcentrumtoepassingen verbeteren om gebruikersinvoer te herkennen. Een van de meest voorkomende scenario's voor herkenning is het afspelen van een bericht voor de gebruiker, waarin wordt gevraagd om een antwoord te geven dat vervolgens wordt herkend door de toepassing, nadat de toepassing is herkend en vervolgens een bijbehorende actie uitvoert. Invoer van bellers kan op verschillende manieren worden ontvangen, waaronder DTMF (gebruikersinvoer via de cijfers op het aanroepende apparaat), spraak of een combinatie van zowel DTMF als spraak.

Spraakherkenning met spraak-naar-tekst

Integratie van Azure Communications-services met Azure AI-services stelt u in staat om audio in realtime te analyseren om gesproken woorden in tekst te transcriberen. Standaard maakt Microsoft gebruik van een Universal Language Model als basismodel dat is getraind met gegevens die eigendom zijn van Microsoft en veelgebruikte gesproken taal weerspiegelt. Dit model is vooraf getraind met dialecten en fonetiek die verschillende gemeenschappelijke domeinen vertegenwoordigen. Zie Talen en spraakondersteuning voor de Speech-service voor meer informatie over ondersteunde talen.

DTMF

DTMF-herkenning (Dual-Tone MultiFrequency) is het proces van het begrijpen van tonen/geluiden die door een telefoon worden gegenereerd wanneer een nummer wordt ingedrukt. Apparatuur aan het ontvangende einde luistert naar de specifieke toon en converteert ze vervolgens naar opdrachten. Deze opdrachten geven over het algemeen de intentie van gebruikers aan bij het navigeren in een menu in een IVR-scenario of in sommige gevallen kunnen worden gebruikt om belangrijke informatie vast te leggen die de gebruiker moet verstrekken via het toetsenblok van de telefoon.

DTMF-gebeurtenissen en de bijbehorende tonen

Gebeurtenis Toon
0 Nul
1 Eén
2 Twee
3 Drie
4 Vier
5 Vijf
6 Zes
7 Zeven
8 Acht
9 Negen
A A
B B
C C
D D
* Sterretje
# Pond

Veelvoorkomende toepassingen

De recognize-actie kan om verschillende redenen worden gebruikt. Hier volgen enkele voorbeelden van hoe ontwikkelaars de recognize-actie in hun toepassing kunnen gebruiken.

Gebruikersbeleving verbeteren met selfserviceprompts

  • Gebruikers kunnen de aanroep beheren: door invoerherkenning in te schakelen, kan de beller door het IVR-menu navigeren en informatie opgeven die kan worden gebruikt om hun query op te lossen.
  • Gebruikersgegevens verzamelen: door invoerherkenning in te schakelen, kan uw toepassing invoer verzamelen van de bellers. Dit kan informatie zijn, zoals rekeningnummers, creditcardgegevens, enzovoort.
  • Antwoord van beller transcriberen: met spraakherkenning kunt u gebruikersinvoer verzamelen en de audio transcriberen naar tekst en deze analyseren om specifieke bedrijfsacties uit te voeren.

Audioprompts onderbreken

Gebruiker kan een IVR-menu verlaten en met een menselijke agent spreken. Met DTMF-onderbreking kunnen gebruikers de stroom van het IVR-menu onderbreken en kunnen chatten met een menselijke agent.

Voorbeeldarchitectuur voor het verzamelen van gebruikersinvoer in een gesprek met spraakherkenning

Diagram met voorbeeldarchitectuur voor Ai-actie herkennen.

Voorbeeldarchitectuur voor het verzamelen van gebruikersinvoer in een gesprek

Actie herkennen

Bekende beperking

  • In-band DTMF wordt niet ondersteund, gebruik in plaats daarvan RFC 2833 DTMF.
  • Tekst-naar-spraak-tekstprompts ondersteunen maximaal 400 tekens, als uw prompt langer is dan dit, raden we u aan om SSML te gebruiken voor op tekst-naar-spraak gebaseerde afspeelacties.
  • Voor scenario's waarin u de quotumlimiet voor de Speech-service overschrijdt, kunt u aanvragen om deze limiet te verhogen door de stappen te volgen die hier worden beschreven.

Volgende stappen