Pokyny pro vyzrazení návrhu pro syntetické hlasy

Důležité

Překlady mimo angličtinu jsou k dispozici pouze pro usnadnění. Projděte si EN-US verzi tohoto dokumentu s konečnou verzí.

Zjistěte, jak vytvářet a udržovat důvěru se zákazníky tím, že jsou transparentní o syntetické povaze vašeho hlasového prostředí.

Co je zveřejnění?

Zveřejnění je způsob, jak lidem dát vědět, že komunikují nebo poslouchají hlas, který je synteticky generován.

Proč je zpřístupnění nezbytné?

Nutnost zveřejnit syntetické původy počítačového hlasu je relativně nová. V minulosti byly hlasy generované počítačem samozřejmě jasně rozpoznatelné – nikdo by si je nikdy nespletl se skutečnou osobou. Každý den se však realismus syntetických hlasů zlepšuje a stává se stále nerozlišitelným od lidských hlasů.

Principy návrhu

Při navrhování syntetických hlasových prostředí je potřeba mít na paměti tyto zásady:

Posílit důvěru: Navrhovat se záměrem selhat Turingův test, aniž by došlo ke snížení kvality zážitku. Informujte uživatele o tom, že komunikují se syntetickým hlasem, a umožněte jim zároveň bezproblémovou interakci se zážitkem.

Přizpůsobit kontextu použití: Zjistěte, kdy, kde a jak budou vaši uživatelé interagovat se syntetickým hlasem, aby poskytli správný typ zveřejnění ve správný čas.

Nastavit jasná očekávání: Umožňuje uživatelům snadno zjistit a pochopit možnosti agenta. Nabídněte příležitosti k získání dalších informací o syntetických hlasových technologiích na vyžádání.

Přijetí selhání: Využijte momenty selhání k posílení schopností agenta.

Jak používat tohoto průvodce

Tato příručka vám pomůže určit, které vzory zpřístupnění jsou nejvhodnější pro vaše syntetické hlasové prostředí. Pak nabízíme příklady, jak a kdy je používat. Každý z těchto vzorů je navržen tak, aby maximalizoval transparentnost s uživateli o syntetické řeči, zatímco zůstává věrný lidsky orientovanému designu.

Vzhledem k rozsáhlému textu pokynů k návrhu hlasových prostředí se zde zaměříme konkrétně na:

  • Posouzení zveřejnění: Proces určení typu zveřejnění doporučeného pro váš syntetický zvukový zážitek
  • Způsoby odhalení: Příklady vzorů zpřístupnění, které lze aplikovat na vaše zkušenosti se syntetickým hlasem.
  • Kdy zveřejnit: Optimální momenty, které se mají zveřejnit na celé cestě uživatele

Posouzení zveřejnění

Představte si očekávání vašich uživatelů ohledně interakce a kontextu, ve kterém budou mít zkušenosti s hlasem. Pokud kontext jasně ukazuje, že syntetický hlas „hovoří“, zveřejnění může být minimální, krátkodobé nebo dokonce zbytečné. Mezi hlavní typy kontextů, které ovlivňují zpřístupnění, patří typ osoby, typ scénáře a úroveň expozice. Pomáhá také zvážit, kdo může naslouchat.

Vysvětlení kontextu

Pomocí tohoto listu můžete určit kontext vašeho syntetického hlasového prostředí. Použijete ho v dalším kroku, kde určíte úroveň zpřístupnění.

Kategorie Kontext použití Potenciální rizika a výzvy
Typ osoby Pokud platí některá z následujících možností, váš profil se vejde do kategorie "Člověku podobná persona":
  • Persona vtělí skutečného člověka bez ohledu na to, jestli se jedná o fiktivní reprezentaci nebo ne. (např. fotografie nebo počítačové vykreslení skutečné osoby)
  • Syntetický hlas je založen na hlasu široce rozpoznatelné skutečné osoby (např. celebrity, politické postavy).
Čím více lidštější reprezentace dáte vaší personě, tím pravděpodobnější je, že ji uživatel přidruží ke skutečné osobě nebo že obsah působí dojmem, že ho mluví skutečná osoba, a ne počítačem generován.
Typ scénáře Pokud platí některá z následujících možností, bude vaše hlasové prostředí odpovídat kategorii Citlivé:
  • Získá nebo zobrazí osobní údaje od uživatele.
  • Vysílání zpráv a informací citlivých na čas (např. tísňové upozornění)
  • Cílem je pomoci skutečným lidem komunikovat mezi sebou (např. číst osobní e-maily nebo texty).
  • Poskytuje lékařskou/zdravotní pomoc.
Použití syntetického hlasu nemusí být pro lidi, kteří ho používají, vhodné nebo důvěryhodné, pokud témata souvisejí s citlivými, osobními nebo naléhavémi záležitostmi. Mohou také očekávat stejnou úroveň empatie a kontextového povědomí jako skutečný člověk.
Úroveň expozice Vaše hlasová zkušenost s největší pravděpodobností spadá do kategorie Vysoká, pokud:
  • Uživatel uslyší syntetický hlas často nebo po dlouhou dobu s ním komunikuje.
Důležitost transparentnosti a budování důvěry s uživateli je ještě vyšší při vytváření dlouhodobých vztahů.

Určení úrovně zpřístupnění

Pomocí následujícího diagramu určete, jestli vaše syntetické hlasové prostředí vyžaduje vysoké nebo nízké zpřístupnění na základě kontextu použití.

Diagram posouzení zpřístupnění

Viz také