Konfigurace základních hlasových agentů

Tento článek popisuje, jak nakonfigurovat základní agenty pro interaktivní hlasovou odezvu (IVR) pro použití v aplikacích Dynamics 365 Contact Center. Základní hlasové agenty jsou obvykle vytvořené tak, aby používaly klasickou orchestraci.

Pokud chcete agenta připravit na hlasové služby, přečtěte si téma Instalace hlasového agenta s Dynamics 365 Contact Center.

Povolit základní hlas

Hlasový agent se liší od chatovacího agenta. Agent s podporou hlasu obsahuje konkrétní systémová témata pro zpracování hlasových scénářů. Chatovací agent používá režim textu . Agent s podporou hlasu používá režim speech & DTMF . Tyto dva způsoby se vzájemně vylučují.

Povolení hlasu umožňuje vytvářet agenty s podporou hlasu a zajišťuje správné vytváření funkcí souvisejících s řečí.

Pokud agenta nespustíte pomocí šablony Voice, musíte zapnout možnost Povolit hlas v nastavení agenta.

  1. S otevřeným agentem přejděte do Nastavení>Hlas.

  2. Vyberte Povolit hlas. Možnost Nastavit jako výchozí způsob vytváření a aktualizace v tématech je již nastavená jako výchozí.

  3. Pokud plánujete používat témata a klasickou orchestraci pro vašeho agenta, vyberte Základní. Další informace najdete v části Volba způsobu řízení konverzace a volba způsobu zpracování řeči.

Poznámka:

Pokud plánujete používat generativní orchestraci pro vašeho agenta, vyberte hlas v reálném čase.

Když zapnete povolit hlas a nastavit hlas jako výchozí způsob vytváření a aktualizace v rámci témat, váš agent získá následující aktualizace:

  • Možnost vytvářet hlasové funkce při přepnutí z textu na řeč a tónovou volbu.
  • Témata hlasového systému Detekce ticha, Nerozpoznaný hlas a Neznámý stisk na ovladači jsou automaticky přidávána pro řešení scénářů souvisejících s řečí.
  • Zvýšit přesnost pomocí dat agenta (ve výchozím nastavení zapnuto), což zlepšuje přesnost rozpoznávání řeči.
  • Stávající pracovní tok agenta se nemění (například téma Hlavní nabídka pro zahájení konverzací s mapovanými DTMF triggery).

Important

  • Nastavení povolit hlas změní jenom možnosti vytváření hlasu, nikoli nastavení kanálu. Zapněte kanál Telefonie pro plně hlasově aktivovaného agenta.
  • Kromě toho nastavení Povolit hlas v agentovi, který nebyl původně nakonfigurovaný pro hlasové funkce, znamená, že agent nemá téma Hlavní nabídka (Preview). V případě potřeby musíte toto téma znovu vytvořit.
  • Pokud nemůžete zapnout funkci Povolit hlas, zkontrolujte prostředí Power Platform, které hostí vašeho agenta, a ujistěte se, že možnost získat nové funkce brzy je pro toto prostředí vypnutá. Další informace naleznete v tématu Nelze zapnout optimalizaci pro hlas.
  • Zvýšení přesnosti nastavení dat agenta funguje jenom v případech, kdy agent s podporou hlasu používá aktivační fráze. Pokud je agent nakonfigurovaný tak, aby používal popisy témat, nemá žádný vliv na přesnost.

Deaktivace optimalizace pro hlas

Pokud nepoužíváte kanál Telefonie, vypněte funkci Aktivovat hlas. Po vypnutí funkce Povolit hlas se zobrazí následující změny:

  • Žádná autorská práce pro hlasové funkce, jako je DTMF a zasahování do hovoru.
  • Je nastavena výchozí modalita text.
  • Žádné zlepšení rozpoznávání řeči, protože neexistuje žádné rozpoznávání řeči.
  • Žádná témata hlasového systému ani globální téma DTMF.

    Poznámka:

    Některá témata mohou hlásit chyby během publikování, pokud stále odkazují na téma DTMF (nyní vypnuté).

  • Tok agenta a nastavení kanálu se nemění, protože vypnutí optimalizace neodstraňuje telefonní kanál.
  • Zapnutí nebo vypnutí funkce Povolit hlas se neprojeví, dokud agenta nepublikujete. Pokud jej omylem zapnete nebo vypnete a agent přepíná mezi modalitami, máte čas to opravit.

Important

Pokud jsou vaše telefonní kanály povolené, vypnutím funkce Povolit hlas může způsobit selhání vašeho agenta, protože všechny triggery DTMF jsou automaticky zakázané.

Použití hlasu jako primárního režimu vytváření

Když zapnete funkci Povolit hlas, automaticky se zapne možnost Nastavit hlas jako výchozí způsob vytváření a aktualizace v rámci témat . Pokud tuto možnost vypnete, nezapomeňte vybrat režim řeči a DTMF na každém uzlu, do kterého chcete přidat hlasové zprávy.

Dostupnost zprávy

Použití textové nebo řečové modality může ovlivnit váš kanál jinak.

Textová modalita Modalita řeči Textový a řečový kanál agenta
Zpráva je k dispozici Zpráva je prázdná Zpráva je k dispozici
Zpráva je prázdná Zpráva je k dispozici Zpráva není k dispozici

Přizpůsobené automatické rozpoznávání řeči

Hlasově ovládaní agenti pro konkrétní doménu, jako je zdravotnictví nebo finance, se mohou setkat s uživateli, kteří používají finanční termíny nebo lékařský žargon. Převedení řeči na text u některých termínů a žargonu jsou pro hlasového agenta obtížné.

Poznámka:

Zvýšení přesnosti nastavení dat agenta funguje jenom v případech, kdy agent s podporou hlasu používá aktivační fráze. Pokud je agent nakonfigurovaný tak, aby používal popisy témat, nemá žádný vliv na přesnost.

Pokud chcete zajistit, aby byl hlasový vstup rozpoznán přesně, vylepšete rozpoznávání řeči:

  1. V agentu vyberte Nastavení>hlasu .

  2. Výběrem možnosti Zvýšit přesnost pomocí dat agenta povolíte výchozí přizpůsobené nastavení automatického rozpoznávání řeči agenta.

  3. Výběrem možnosti Uložit potvrdíte změny.

  4. Publikujte agenta, aby se projevily nové změny.

Referenční informace k možnostem hlasu na úrovni agenta

Použijte nastavení hlasu k nastavení časových limitů pro různé hlasové funkce. Nastavení, která použijete na této stránce, se stanou výchozími nastaveními témat, která v agentu vytvoříte.

Chcete-li změnit možnosti časového limitu na úrovni agenta:

  1. Přejděte na stránku Nastavení pro svého agenta a vyberte Hlas.

  2. Vyberte požadovaná nastavení a upravte výchozí nastavení agenta.

  3. Výběrem možnosti Uložit potvrdíte změny.

Nastavení na úrovni agenta

V následující tabulce jsou uvedeny jednotlivé možnosti a jejich vztah k nastavení na úrovni uzlů.

Sekce na úrovni agenta s podporou hlasu Nastavení Description Výchozí hodnota Přepsání na úrovni uzlu
Tónová volba Časový limit mezi číslicemi Maximální doba v milisekundách povolená při čekání na další vstup klíče DTMF. Použije vícemístný DTMF vstup pouze tehdy, když uživatelé nedosahují maximální délky vstupu. 3000 milisekund (ms) Uzel otázky s hlasovými vlastnostmi pro vstup DTMF s více číslicemi
Tónová volba Časový limit ukončení Maximální doba trvání v milisekundách pro čekání na klíč ukončení DTMF. Limit platí, když uživatel dosáhne maximální vstupní délky a nestiskl klávesu ukončení. Platí pouze pro vícečíselný DTMF vstup.

Když vyprší časový limit a nedorazí ukončovací klíč tónové volby, agent ukončí rozpoznávání a vrátí výsledek aktuálního rozpoznání.

Pokud je nastavená možnost "pokračovat bez čekání", agent nečeká na ukončovací klíč. Agent se vrátí ihned poté, co uživatel zadá maximální délku.
2000 ms Uzel otázky s hlasovými vlastnostmi pro vstup DTMF s více číslicemi
Detekce ticha Časový limit detekce ticha Maximální ticho v milisekundách povoleno při čekání na vstup uživatele. Limit platí v případě, že agent nezjistí žádný vstup uživatele. Výchozí hodnota je „Bez časového limitu ticha“. Agent čeká donekonečna na vstup uživatele.

Detekce ticha po skončení hlasového projevu, která měří dobu po skončení řeči.
Žádný časový limit ztišení Uzel otázky s hlasovými vlastnostmi pro vstup DTMF s více číslicemi

Systémové téma (vlastnosti triggeru detekce ticha) pro Konfigurace detekce ticha a časových limitů
Sběr řečových dat Časový limit dokončení výroku Limit platí, když uživatel udělá pauzu během řeči nebo po ní. Pokud je pauza delší než časový limit, agent předpokládá, že uživatel dokončil řeč.

Maximální hodnota časového limitu ukončení promluvy je 3000 ms. Cokoli nad 3000 ms se sníží na 3000 ms.
1500 milisekund Uzel otázky s hlasovými vlastnostmi
Sběr řečových dat Časový limit rozpoznávání řeči Určuje, kolik času agent povolí pro vstup uživatele poté, co začne mluvit. Výchozí hodnota je 12 000 milisekund (kolem 12 sekund). Neomezený čas pro rozpoznání znamená nekonečný čas. Agent otázku zopakuje. Pokud není žádná odpověď, hlas je mimo Časový limit vypršení rozpoznávání řeči. 12 000 ms Uzel otázky s hlasovými vlastnostmi
Latence v zasílání zpráv Prodleva před odesláním zprávy Určuje, jak dlouho agent čeká, než doručí zprávu o latenci po spuštění požadavku na operaci na pozadí. Časování je nastaveno v milisekundách. 500 ms Vlastnosti uzlu akce pro dlouhotrvající provoz
Latence v zasílání zpráv Minimální doba přehrávání Zpráva o latenci se přehrává po minimální dobu, i když se operace na pozadí dokončí během přehrávání zprávy. Časování je nastaveno v milisekundách. 5000 milisekund Vlastnosti režimu akce pro dlouhotrvající provoz
Citlivost řeči Utajení Řídí, jak systém vyvažuje detekci řeči a hluku na pozadí. Snižte citlivost v hlučných prostředích, veřejných prostorech a při použití hands-free. Zvyšte citlivost v tichých prostředích, pro tiché uživatele nebo při detekci hlasových příkazů. Výchozí nastavení je 0,5. 0.5 Pro tento ovládací prvek neexistují žádná překrytí na úrovni uzlu.

Poznámka:

  • Publikování agenta s rozsáhlými aktivačními frázemi a velkým počtem entit trvá déle.
  • Pokud více uživatelů publikuje stejného agenta současně, akce publikování se zablokuje. Agenta musíte znovu publikovat, jakmile ostatní dokončí úpravy existujícího agenta.

Další informace o základech publikování najdete v tématu Klíčové koncepty – publikování a nasazení agenta.

Zapnutí vpadnutí

Když povolíte narušení hovoru, můžou uživatelé vašeho agenta přerušit. Tato funkce je užitečná, když uživatel agenta nemusí slyšet celou zprávu. Volající už například mohou znát možnosti nabídky, protože je slyšeli v minulosti. Pomocí funkce barge-in může uživatel agenta zadat požadovanou možnost, i když agent není dokončen se seznamem všech možností.

Kdy zakázat barge-in

  • Zakažte funkci přerušení, pokud jste nedávno aktualizovali zprávu agenta nebo pokud by zpráva o dodržování předpisů neměla být přerušena.
  • Zakažte funkci přerušení pro první zprávu agenta, abyste zajistili, že uživatelé agenta budou informováni o nových nebo důležitých informacích.

Specifications

  • Barge-in podporuje přerušení na základě DTMF a hlasu ze strany uživatele agenta.

  • Můžete ovládat přerušení pro každou zprávu v jedné dávce. Umístěte uzly barge-in-disabled v pořadí před každý uzel, kde je povoleno vpadnutí. V opačném případě se systém považuje barge-in-disabled za zprávu allow-barge-in.

    Snímek obrazovky umístění funkcí vpadnutí a deaktivace vpadnutí v uzlech sdělení.

    Po dokončení jedné dávkové fronty se automatické nastavení pro další dávku resetuje. Příznak barge-in u každé další zprávy ji řídí. Jakmile sekvence začne znovu, můžete umisťovat uzly s deaktivovaným vpadnutím.

Tip

Pokud po sobě jdoucí uzly Message následuje uzel Question, jsou hlasové zprávy pro tyto uzly definovány jako jedna dávka. Jedna dávka začíná uzlem zprávy a zastaví se na uzlu otázky, který čeká na vstup uživatele.

Vyhněte se deaktivaci funkce přerušení u zdlouhavých zpráv, zejména pokud očekáváte, že uživatelé často interakcují se systémem. Pokud váš uživatel agenta již zná možnosti nabídky, dovolte mu samostatně vybrat, kam chce pokračovat.

Nastavení funkce přerušení

  1. Vyberte uzel Zprávy nebo Otázky a nastavte požadovaný mód na Řeč a DTMF.

  2. Vyberte tři tečky (...) uzlu a pak vyberte Vlastnosti.

    • U uzlů Zpráva se panel Vlastnosti aktivity odesílání otevře na straně plátna pro vytváření obsahu.

      Vyberte Povolit vpadnutí.

    • Pro uzly Otázka se otevře panel Vlastnosti otázky a poté vyberte Hlas.

      Ve vlastnostech Hlas vyberte Povolit vpadnutí.

  3. Uložte téma.

Konfigurace detekce ticha a časových limitů

Detekce ticha umožňuje nakonfigurovat, jak dlouho agent čeká na vstup uživatele, a akci, kterou trvá, pokud agent neobdrží žádný vstup. Detekce ticha je nejužitečnější v reakci na otázku na úrovni uzlů nebo když agent čeká na spouštěcí frázi, aby mohl začít nové téma.

Můžete nakonfigurovat výchozí časové limity pro témata.

Abyste mohli přepsat výchozí hodnoty pro uzel v síti:

  1. Vyberte tři tečky (...) uzlu a pak vyberte Vlastnosti.

    Otevře se panel Vlastnosti otázky.

  2. Vyberte Hlas a proveďte úpravy následujících nastavení:

    Možnost časového limitu detekce ticha Description
    Použití nastavení agenta Pro detekci ticha používá uzel globální nastavení.
    Deaktivovat pro tento prvek Agent čeká na odpověď neomezeně dlouho.
    Přizpůsobení v milisekundách Agent čeká po určitou dobu, než otázku zopakuje.

Náhradní akce

Některá chování můžete nakonfigurovat jako záložní akci:

  • Kolikrát by měl agent zopakovat otázku
  • Co by měla oznamovací zpráva obsahovat
  • Co by měl agent udělat po zadaném počtu opakování

Hlasový vstup

Pro vstup řeči zadejte hodnoty pro následující nastavení:

  • Vypršení časového limitu ukončení promluvy: Jak dlouho agent počká, až uživatel dokončí mluvení.
  • Časový limit rozpoznávání řeči: Kolik času agent dává uživateli, jakmile začne reagovat.

Chcete-li nakonfigurovat chování detekce ticha, když agent čeká na spouštěcí frázi, upravte nastavení v systémovém tématu Při tichu.

Přidání zprávy o latenci pro dlouho běžící operace

U dlouhých backendových operací může agent odeslat zprávu uživatelům, aby je upozornil na delší procesy. Agenti v kanálu pro zasílání zpráv mohou také odeslat zprávu o latenci.

Přehrávání zvuku zprávy s latencí Zpráva o latenci v chatu
Pokračuje v opakující se smyčce, dokud se operace nedokončí. Odesláno pouze jednou při dosažení zadané latence.

V Copilot Studiu může váš agent po aktivaci toku Power Automate opakovat zprávu:

  1. Přidejte uzel Akce, který spustí tok.

  2. Vyberte tři tečky (...) uzlu a poté vyberte Vlastnosti. Otevře se panel Vlastnosti akce.

  3. Vyberte položku Odeslat zprávu.

  4. V sekci Zpráva zadejte, co má agent říct. Pomocí SSML můžete upravit zvuk zprávy. Agent opakuje zprávu, dokud není proces dokončen.

V části Zpoždění můžete upravit, jak dlouho má agent čekat, než zopakuje zprávu. Nastavte minimální dobu čekání, i když se proces dokončí.

Konfigurace ukončení hovoru

Pokud chcete nakonfigurovat agenta, aby ukončil hovor, přidejte nový uzel (+) a vyberte Správa témat>Ukončit konverzaci.

Snímek obrazovky nové nabídky uzlu se zvýrazněnými možnostmi Správa tématu a Ukončit konverzaci.

Detekce počítačů pro odpovědi

Agenta lze nakonfigurovat tak, aby detekoval záznamník a zanechal zprávu pro uživatele agenta poté, co dokončí svou zprávu. Téma detekce záznamníkusystému umožňuje vytvořit vlastní zprávu pro scénáře, kdy váš agent narazí na hlasovou poštu uživatele. V uzlu Zpráva definujte zprávu, která zbývá, když agent narazí na počítač pro odpovídání.

Snímek obrazovky s tématem

Formátování syntézy řeči pomocí SSML

Pomocí jazyka SSML (Speech Synthesis Markup Language) můžete změnit, jak agent při čtení zpráv nahlas zní. Můžete například změnit výšku nebo frekvenci mluvených slov, rychlost a hlasitost.

SSML používá značky k uzavření textu, který chcete upravit, podobně jako HTML. V Copilot Studiu použijte následující značky:

Značka SSML Description Odkaz na dokumentaci hlasové služby
<audio src="_URL to an audio file_"/> Přidejte adresu URL zvukového souboru do značky. K souboru musí mít přístup uživatel agenta. Přidání nahraného zvuku
<break /> Mezi slova vkládejte pauzy nebo přestávky. Do značky vložte možnosti přerušení. Přidání přerušení
<emphasis> Text, který chcete upravit</emphasis> Přidávejte ke slovům nebo frázím stupně důrazu. Přidejte možnosti zvýraznění do úvodní značky. Přidejte uzavírací značku za text, který chcete upravit. Úprava možností zvýraznění
<prosody> Text, který chcete upravit</prosody> Určete změny tónu, tvaru, rozsahu, rychlosti a hlasitosti. Přidejte možnosti prozodie do úvodního tagu. Přidejte uzavírací značku za text, který chcete upravit. Upravte možnosti prozódie
<lang xml:lang="xx-XX"> Text, který chcete upravit</lang> Při použití vícejazyčného neurálního hlasu můžete upravit jazyk řeči v téže zprávě. Úprava mluvených jazyků

Poznámka:

Při použití značky <audio src="_URL to an audio file_"/>, pokud adresu URL uložíte do proměnné, zakódujte adresu URL před vložením do značky SSML pro zdroj zvuku ve zprávě. Pomocí funkce EncodeHTML Power Fx zakódujte adresu URL při přiřazování proměnné v akci přiřazení.

Screenshot hlasové zprávy s přidanými značkami SSML.

Najít a použít značku

SSML používá značky k uzavření textu, který chcete upravit, jako HTML.

V Copilot Studiu použijte následující značky:

  1. Vyberte uzel Zpráva nebo Otázka . Změňte režim na Speech & DTMF.

  2. Otevřete nabídku Značky SSML a zvolte značku.

    Okno zprávy je vyplněno značkou. Pokud již ve schránce se zprávou máte text, připojí se kód značky na konec vaší zprávy.

  3. Obklopte text, který chcete upravit, úvodní a závěrečnou značkou. Můžete kombinovat více značek a přizpůsobit jednotlivé části zprávy jednotlivými značkami.

Tip

Můžete ručně zadat značky SSML, které se nezobrazují v nabídce pomocníka. Chcete-li se dozvědět více o dalších značkách, které můžete použít, podívejte se do tématu Zlepšení syntézy pomocí značkovacího jazyka pro syntézu řeči.

Přepojení hovoru na zástupce nebo externí telefonní číslo

Agenta můžete nastavit tak, aby hovor přepošl na externí telefonní číslo. Copilot Studio podporuje nevidomý přenos na telefonní číslo veřejné telefonní sítě a přímé číslo směrování.

Poznámka:

K zpracování přenosů volání můžete použít také hlavičky SIP X. Pro více informací se podívejte na Konfigurace SIP X-hlaviček pro agenty s podporou hlasu.

Předání hovoru na externí telefonní číslo:

  1. V tématu, které chcete upravit, přidejte nový uzel (+). V nabídce uzlu vyberte Správa témat a potom Převést konverzaci.

  2. V části Typ převodu vyberte Přenos externího telefonního čísla a zadejte číslo převodu.

  3. (Volitelně) přidejte do telefonního hovoru hlavičku SIP (Session Initiation Protocol) User-to-User Information (UUI).

    Tato hlavička je řetězec párů key=value, bez mezer nebo speciálních znaků, zobrazený pro externí systémy ke čtení.

    1. Vyberte tři tečky (...) uzlu a poté vyberte Vlastnosti. Otevře se panel Přenést vlastnosti konverzace.

    2. V části Záhlaví SIP UUI zadejte informace, které chcete odeslat během přesměrování hovoru. Při přenosu na externí telefonní číslo nejsou proměnné podporovány.

    Upozornění

    Odesláno je pouze prvních 256 znaků řetězce. Záhlaví přijímá pouze čísla, písmena, rovnítko (=) a středníky (;). Všechny ostatní znaky, včetně mezer, složených závorek, hranatých závorek nebo vzorců, nejsou podporovány, což může způsobit selhání přenosu.

Tip

Uveďte a + ve svém telefonním čísle pro odpovídající kód země.

Odchozí přenos pomocí SIP UUI pro cílové telefonní číslo musí používat přímé směrování. Telefonní čísla veřejné telefonní sítě (PSTN) nepodporují přenosy hlaviček SIP UUI.

Chcete-li provést předání zástupci, přečtěte si část Explicitní triggery.

Použití hlasových proměnných

Copilot Studio podporuje základní soubor proměnných. Můžete použít předdefinované proměnné nebo vytvořit vlastní proměnné.

Poznámka:

  • Další informace o použití a vytváření proměnných v Copilot Studiu najdete v tématu Work with variables.
  • Informace o proměnných dalších aktivit a konverzací, které jsou k dispozici pro hlasové agenty, najdete v tématu Proměnné pro hlasové agenty.

Agent s podporou hlasu v Copilot Studiu podporuje kontextové proměnné. Tyto proměnné vám pomůžou integrovat konverzace agenta s Dynamics 365 Contact Center při přenosu hovoru.

Další informace o kontextových proměnných v Dynamics 365 Contact Center najdete v tématu Kontextové proměnné pro roboty Copilot Studio.

Tato integrace podporuje tyto scénáře s následujícími proměnnými při přenosu:

Proměnná Typ Description
System.Activity.From.Name Řetězec ID uživatele volajícího agenta
System.Activity.Recipient.Name Řetězec Číslo použité k volání nebo připojení k agentovi
System.Conversation.SipUuiHeaderValue Řetězec Hodnota SIP hlavičky při přenosu přes číslo přímého směrování
System.Activity.UserInputType Řetězec Zda uživatel agenta použil v konverzaci tónovou volbu nebo řeč
System.Activity.InputDTMFKey Řetězec Nezpracovaná DTMF vstup agentního uživatele
System.Conversation.OnlyAllowDTMF logický Hlas ignoruje hlasový vstup, když je nastavená hodnota true
System.Activity.SpeechRecognition.Confidence Číslo Hodnota spolehlivosti (mezi 0 a 1) z poslední události rozpoznávání řeči
System.Activity.SpeechRecognition.MinimalFormattedText Řetězec Výsledky rozpoznávání řeči (jako nezpracovaný text) před tím, než Copilot Studio použilo vyhrazený model natrální rozpoznávání jazyka

Poznámka:

Pokud použijete proměnnou nastavenou System.Conversation.OnlyAllowDTMF na true, ujistěte se, že používáte následující konfiguraci:

  • Všechny uzly zpráv, které neočekávají uživatelský vstup, mají funkci barge-in vypnutou, nebo za nimi následují uzly otázky s odpovídajícími mapováními DTMF.
  • Vyhněte se odesílání informačních zpráv mezi uzly Question, pokud je globálně zapnut DTMF-only.
  • Pro lepší kontrolu použijte mapování DTMF pro každou otázku místo globální konfirgurace pouze DMTF.

Informační zprávy odeslané, když je zapnutý režim jen DTMF, může způsobit, že platforma vygeneruje prázdnou gramatiku DTMF, což vede k chybám telefonie. Proto se doporučuje použít mapování DTMF pro jednotlivé otázky.