Geluid afspelen in gesprek

Artikel
03/05/2024

Met de afspeelactie die via de Azure Communication Services Call Automation SDK wordt geboden, kunt u audioprompts afspelen aan deelnemers aan het gesprek. Deze actie kan worden geopend via de implementatie aan de serverzijde van uw toepassing. U kunt audio afspelen om deelnemers te bellen via een van twee methoden;

Azure Communication Services toegang bieden tot vooraf opgenomen audiobestanden van WAV-indeling, waartoe Azure Communication Services toegang heeft met ondersteuning voor verificatie
Reguliere tekst die kan worden geconverteerd naar spraakuitvoer via de integratie met Azure AI-services.

U kunt de zojuist aangekondigde integratie tussen Azure Communication Services en Azure AI-services gebruiken om persoonlijke antwoorden af te spelen met behulp van Azure Text-To-Speech. U kunt menselijke, zoals vooraf gebouwde neurale stemmen uit de doos gebruiken of aangepaste neurale stemmen maken die uniek zijn voor uw product of merk. Zie Taal- en spraakondersteuning voor de Speech-service voor meer informatie over ondersteunde stemmen, talen en landinstellingen.

Notitie

Azure Communication Services ondersteunt momenteel twee bestandsindelingen, MP3-bestanden met ID3V2TAG- en WAV-bestanden die zijn geformatteerd als 16-bits PCM monokanaalaudio opgenomen op 16KHz. U kunt uw eigen audiobestanden maken met spraaksynthese met het hulpprogramma Voor het maken van audio-inhoud.

Vooraf gemaakte neurale tekst naar spraakstemmen

Microsoft maakt gebruik van deep neurale netwerken om de grenzen van traditionele spraaksynthese te overwinnen met betrekking tot stress en intonatie in gesproken taal. Prosody voorspelling en spraaksynthese vinden gelijktijdig plaats, wat resulteert in een meer vloeiende en natuurlijke klinkende uitvoer. U kunt deze neurale stemmen gebruiken om interacties met uw chatbots en spraakassistenten natuurlijker en aantrekkelijker te maken. Er zijn meer dan 100 vooraf gebouwde stemmen waaruit u kunt kiezen. Meer informatie over Azure Text-to-Speech-stemmen.

Veelvoorkomende toepassingen

De play-actie kan op veel manieren worden gebruikt, enkele voorbeelden van hoe ontwikkelaars de play-actie in hun toepassingen kunnen gebruiken, worden hier vermeld.

Aankondigingen

Uw toepassing wil misschien een of andere aankondiging afspelen wanneer een deelnemer deelneemt of het gesprek verlaat om andere gebruikers op de hoogte te stellen.

Zelfbedieningsklanten

In scenario's met IVR's en virtuele assistenten kunt u uw toepassing of bots gebruiken om audioprompts af te spelen voor bellers. Deze prompt kan de vorm hebben van een menu om de beller door hun interactie te begeleiden.

Houd muziek vast

De afspeelactie kan ook worden gebruikt voor het afspelen van muziek voor bellers. Deze actie kan worden ingesteld in een lus, zodat de muziek blijft afspelen totdat een agent beschikbaar is om de beller te helpen.

Nalevingsberichten afspelen

Als onderdeel van nalevingsvereisten in verschillende branches, wordt verwacht dat leveranciers juridische of nalevingsberichten afspelen aan bellers, bijvoorbeeld 'Deze oproep wordt vastgelegd voor kwaliteitsdoeleinden'.

Voorbeeldarchitectuur voor het afspelen van audio in gesprek met tekst-naar-spraak

Diagram met voorbeeldarchitectuur voor Play with AI.

Voorbeeldarchitectuur voor het afspelen van audio in een gesprek

Schermopname van stroom voor afspeelactie.

Bekende beperkingen

Tekst-naar-spraak-tekstprompts ondersteunen maximaal 400 tekens, als uw prompt langer is dan dit, raden we u aan om SSML te gebruiken voor op tekst-naar-spraak gebaseerde afspeelacties.
Voor scenario's waarin u de quotumlimiet voor de Speech-service overschrijdt, kunt u aanvragen om deze limiet te verhogen door de stappen te volgen die hier worden beschreven.

Volgende stappen

Bekijk onze handleiding voor meer informatie over het afspelen van aangepaste spraakprompts aan gebruikers.
Meer informatie over gebruiks- en operationele logboeken die zijn gepubliceerd door gespreksautomatisering.
Meer informatie over het verzamelen van klantinvoer.