Spela upp ljud i samtal

Med uppspelningsåtgärden som tillhandahålls via Azure Communication Services Call Automation SDK kan du spela upp ljudmeddelanden till deltagare i samtalet. Den här åtgärden kan nås via implementeringen på serversidan av ditt program. Du kan spela upp ljud för att anropa deltagarna via en av två metoder;

  • Ge Azure Communication Services åtkomst till förinspelade ljudfiler i WAV-format som Azure Communication Services kan komma åt med stöd för autentisering
  • Vanlig text som kan konverteras till talutdata genom integrering med Azure AI-tjänster.

Du kan använda den nyligen tillkännagivna integreringen mellan Azure Communication Services och Azure AI-tjänster för att spela upp anpassade svar med hjälp av Azure Text-To-Speech. Du kan använda mänskliga som fördefinierade neurala röster direkt eller skapa anpassade neurala röster som är unika för din produkt eller ditt varumärke. Mer information om röster, språk och språk som stöds finns i Språk och röststöd för Speech-tjänsten.

Kommentar

Azure Communication Services har för närvarande stöd för två filformat, MP3-filer med ID3V2TAG- och WAV-filer som är formaterade som 16-bitars PCM-monokanalljud som spelas in vid 16KHz. Du kan skapa egna ljudfiler med hjälp av talsyntes med verktyget Skapa ljudinnehåll.

Fördefinierade neurala text till talröster

Microsoft använder djupa neurala nätverk för att övervinna gränserna för traditionell talsyntes när det gäller stress och intonation i talat språk. Prosody-förutsägelse och röstsyntes sker samtidigt, vilket resulterar i en mer flytande och naturlig ljudutdata. Du kan använda dessa neurala röster för att göra interaktioner med dina chattrobotar och röstassistenter mer naturliga och engagerande. Det finns över 100 fördefinierade röster att välja mellan. Läs mer om Azure Text-to-Speech-röster.

Vanliga användningsfall

Spelåtgärden kan användas på många sätt, några exempel på hur utvecklare kanske vill använda uppspelningsåtgärden i sina program visas här.

Meddelanden

Ditt program kanske vill spela upp någon form av meddelande när en deltagare ansluter eller lämnar anropet för att meddela andra användare.

Självbetjäningskunder

I scenarier med IVR och virtuella assistenter kan du använda ditt program eller dina robotar för att spela upp ljudmeddelanden till uppringare. Den här uppmaningen kan vara i form av en meny som vägleder uppringaren genom deras interaktion.

Håll musik

Spelåtgärden kan också användas för att spela hold-musik för uppringare. Den här åtgärden kan konfigureras i en loop så att musiken fortsätter att spelas upp tills en agent är tillgänglig för att hjälpa anroparen.

Spela upp efterlevnadsmeddelanden

Som en del av efterlevnadskraven i olika branscher förväntas leverantörer spela upp juridiska meddelanden eller efterlevnadsmeddelanden till uppringare, till exempel "Det här samtalet registreras i kvalitetssyfte".

Exempelarkitektur för att spela upp ljud i anrop med text-till-tal

Diagram som visar exempelarkitektur för Spela upp med AI.

Exempelarkitektur för att spela upp ljud i ett anrop

Skärmbild av flöde för uppspelningsåtgärd.

Kända begränsningar

  • Text-till-tal-textprompter stöder högst 400 tecken, om din fråga är längre än detta föreslår vi att du använder SSML för text-till-tal-baserade uppspelningsåtgärder.
  • För scenarier där du överskrider kvotgränsen för Speech-tjänsten kan du begära att den här gränsen ökas genom att följa stegen som beskrivs här.

Nästa steg