Wzorce projektowe ujawniania dla syntetycznych głosów

Ważne

Tłumaczenia nieanglojęzyczne są dostępne tylko dla wygody. Zapoznaj się zEN-US wersją tego dokumentu, aby uzyskać ostateczną wersję.

Teraz, gdy określisz odpowiedni poziom ujawnienia tekstu w środowisku awatara mowy, warto zapoznać się z potencjalnymi wzorcami projektowymi.

Omówienie wzorca projektowego

Można zastosować spektrum wzorców projektowych dotyczących ujawniania informacji w doświadczeniu z syntezatorami głosu. Jeśli wynikiem oceny stopnia ujawnienia było "wysokie ujawnienie", zalecamy jawne ujawnienie, co oznacza otwarte komunikowanie pochodzenia syntetycznego głosu. Niejawne ujawnienie obejmuje wskazówki i wzorce interakcji, które przyczyniają się do poprawy doświadczeń głosowych, niezależnie od tego, czy wymagane poziomy ujawnienia są wysokie, czy niskie.

Diagram spektrum wzorców ujawniania.

Kategoria Przykłady
Jawne wzorce ujawniania
Niejawne wzorce ujawniania

Użyj poniższego wykresu, aby odwoływać się bezpośrednio do wzorców, które mają zastosowanie do syntetycznego głosu. Niektóre inne warunki na tym wykresie mogą również mieć zastosowanie do danego scenariusza:

Jeśli twoje doświadczenie z syntezowanym głosem... Zalecenia Wzorce projektowe
Wymaga wysokiego ujawnienia Użyj co najmniej jednego jawnego wzorca i niejawnych wskazówek z góry, aby pomóc użytkownikom tworzyć skojarzenia.
Wymaga niskiego ujawnienia Ujawnienie może być minimalne lub niepotrzebne, ale może korzystać z niektórych niejawnych wzorców.
Ma wysoki poziom zaangażowania Buduj z myślą o długoterminowości i oferuj wiele punktów dostępu do informacji na ścieżce użytkownika. Zdecydowanie zaleca się doświadczenie wdrażania.
Uwzględnia dzieci jako główną grupę docelową odbiorców Skieruj uwagę na rodziców jako główną grupę docelową ujawnienia i upewnij się, że mogą skutecznie przekazywać tę informację dzieciom.
Obejmuje niewidomych użytkowników lub osoby słabowidzące jako głównych odbiorców Uwzględniaj wszystkich użytkowników i upewnij się, że każda forma ujawnienia wizualnego ma skojarzone alternatywne efekty tekstowe lub dźwiękowe. Przestrzegaj standardów ułatwień dostępu dla współczynnika kontrastu i rozmiaru wyświetlania. Użyj sygnałów słuchowych, aby komunikować ujawnienie.
Jest bez ekranu, bez urządzenia lub używa głosu jako podstawowego lub tylko trybu interakcji Użyj sygnałów słuchowych, aby komunikować ujawnienie.
Potencjalnie obejmuje wielu użytkowników/odbiorników (np. asystenta osobistego w wielu gospodarstwach domowych) Należy pamiętać o różnych kontekstach użytkowników i poziomach zrozumienia oraz zaoferować wiele możliwości informowania w podróży użytkownika.

Jawne ujawnienie

Jeśli syntetyczne środowisko głosu wymaga wysokiego ujawnienia, najlepiej użyć co najmniej jednego z następujących wyraźnych wzorców, aby wyraźnie określać syntetyczny charakter.

Przezroczyste wprowadzenie

Przed rozpoczęciem doświadczenia głosowego, w pełni ujawnij pochodzenie głosu asystenta cyfrowego oraz jego możliwości. Optymalnym momentem na użycie tego wzorca jest dołączanie nowego użytkownika lub wprowadzenie nowych funkcji do powracającego użytkownika. Implementowanie niejawnych wskazówek podczas wprowadzenia ułatwia użytkownikom tworzenie modelu psychicznego o syntetycznym charakterze agenta cyfrowego.

Doświadczenie użytkownika po raz pierwszy

Diagram przedstawiający przezroczyste wprowadzenie podczas pierwszego uruchomienia.
Syntetyczny głos jest wprowadzany podczas dołączania nowego użytkownika.

Zalecenia

  • Opisz, że głos jest sztuczny (np. "cyfrowy")
  • Opisywanie możliwości działania agenta
  • Jawne stwierdzanie pochodzenia głosu
  • Zaoferuj punkt wejścia, aby dowiedzieć się więcej o syntetycznym głosie

Doświadczenie powracającego użytkownika

Jeśli użytkownik pomija proces wprowadzania, kontynuuj oferowanie punktów wejścia do środowiska Transparent Introduction, dopóki użytkownik nie aktywuje głosu po raz pierwszy.

Diagram przedstawiający przejrzyste wprowadzenie podczas doświadczenia użytkownika przy ponownym odwiedzeniu.
Zapewnij spójny punkt wejścia do doświadczenia syntezy głosu. Zezwól użytkownikowi na powrót do procesu wprowadzania po pierwszym użyciu głosu w dowolnym momencie we ścieżce użytkownika.

Słowne przezroczyste wprowadzenie

Wypowiedziany monit z informacją o pochodzeniu głosu asystenta cyfrowego jest wystarczająco wyraźny sam w sobie, aby osiągnąć ujawnienie. Ten wzorzec jest najlepszy w scenariuszach o wysokim ujawnieniu, w których głos jest jedynym dostępnym trybem interakcji.

Diagram werbalnego, przezroczystego wprowadzenia.
Użyj przezroczystego wprowadzenia, gdy w środowisku użytkownika występują chwile, w których możesz już wprowadzić lub przypisać głos danej osoby.

Diagram werbalnego wprowadzenia w pierwszej osobie.
Aby uzyskać dodatkową przejrzystość, aktor głosowy może ujawnić pochodzenie syntetycznego głosu w pierwszej osobie.

Wyraźna linia autorska

Użyj tego wzorca, jeśli użytkownik będzie wchodzić w interakcję z odtwarzaczem audio lub składnikiem interaktywnym w celu wyzwolenia głosu.

Diagram podpisu redakcyjnego w scenariuszu w mediach informacyjnych.
Jawne byline to przypisanie miejsca, z którego pochodzi głos.

Zalecenia

  • Punkt wejścia, aby dowiedzieć się więcej o głosie syntetyzowanym.

Dostosowywanie i kalibracja

Zapewnij użytkownikom kontrolę nad sposobem, w jaki asystent cyfrowy reaguje na nie (tj. jak brzmi głos). Gdy użytkownik wchodzi w interakcję z systemem na własnych warunkach i z określonymi celami, to z definicji rozumie już, że nie jest to prawdziwa osoba.

Kontrola użytkownika

Oferuj opcje, które mają znaczący i zauważalny wpływ na doświadczenie z głosem syntetycznym.

Diagram preferencji użytkownika.
Preferencje użytkownika umożliwiają użytkownikom dostosowywanie i ulepszanie środowiska użytkownika.

Zalecenia

  • Zezwalaj użytkownikom na dostosowywanie głosu (np. wybieranie języka i typu głosu)
  • Zapewnienie użytkownikom sposobu na nauczenie systemu reagowania na ich unikatowy głos (np. kalibracja głosu)
  • Optymalizowanie pod kątem interakcji generowanych przez użytkownika lub kontekstowych (np. przypomnień)

Dostosowywanie osoby

Oferują sposoby dostosowywania głosu asystenta cyfrowego. Jeśli głos jest oparty na znanej osobie lub powszechnie rozpoznawalnej postaci, rozważ użycie zarówno wizualnych, jak i mówionych wprowadzeń, gdy użytkownicy zapoznają się z głosem.

Diagram dostosowywania głosu.
Oferowanie możliwości wyboru z zestawu głosów pomaga przekazać sztuczną naturę.

Zalecenia

  • Zezwalaj użytkownikom na wyświetlanie podglądu dźwięku poszczególnych głosów
  • Używanie autentycznego wprowadzenia dla każdego głosu
  • Punkty dostępu do informacji, aby dowiedzieć się więcej o głosie syntetyzowanym

Ujawnienie rodziców

Oprócz przestrzegania przepisów COPPA, należy poinformować rodziców, jeśli główną grupą docelową są małe dzieci, a poziom ekspozycji jest wysoki. W przypadku wrażliwych zastosowań należy rozważyć uzyskanie doświadczenia, dopóki dorosły nie przyznał się do korzystania z syntetycznego głosu. Zachęcaj rodziców do przekazywania wiadomości swoim dzieciom.

Diagram ujawnienia dla rodziców.
Przejrzyste wprowadzenie zoptymalizowane dla rodziców zapewnia, że dorosły został poinformowany o syntetycznym charakterze głosu, zanim dziecko z nim wchodzi w interakcję.

Zalecenia

  • Skieruj rodziców jako główną grupę docelową dla ujawnień
  • Zachęcanie rodziców do przekazywania informacji swoim dzieciom
  • Punkty dostępu do informacji, aby dowiedzieć się więcej o głosie syntetyzowanym
  • Ogranicz dostęp do doświadczenia, prosząc rodziców o proste pytanie kontrolne, aby potwierdzić, że przeczytali oświadczenie.

Zapewnianie możliwości uzyskania dodatkowych informacji na temat sposobu tworzenia głosu

Oferują kontekstowe punkty wejścia do strony, wyskakujących okienek lub witryn zewnętrznych, które zawierają więcej informacji na temat syntetycznej technologii głosowej. Możesz na przykład wyświetlić link, aby dowiedzieć się więcej podczas wdrażania lub gdy użytkownik otrzymuje prośbę o więcej informacji podczas konwersacji.

Diagram punktu wejścia, aby dowiedzieć się więcej.
Przykład punktu wejścia, który oferuje możliwość uzyskania dodatkowych informacji na temat syntetyzowanego głosu.

Gdy użytkownik zażąda więcej informacji o syntetycznym głosie, głównym celem jest edukowanie ich o pochodzeniu syntetycznego głosu i przejrzystość technologii.

Diagram przedstawiający udostępnianie użytkownikom dodatkowych informacji o syntetycznym głosie.
Więcej informacji można znaleźć na zewnętrznej witrynie pomocy.

Zalecenia

  • Upraszczanie złożonych pojęć i unikanie używania żargonu legalnego i technicznego
  • Nie ukrywaj tej zawartości w polityce prywatności i warunkach użytkowania
  • Zachowaj zwięzłość zawartości i używaj obrazów, gdy są dostępne

Niejawne ujawnienie

Spójność jest kluczem do osiągnięcia domniemanego ujawnienia w trakcie podróży użytkownika. Spójne stosowanie wskazówek wizualnych i słuchowych między urządzeniami i trybami interakcji może pomóc w tworzeniu skojarzeń między niejawnymi wzorcami a jawnym ujawnieniem.

Diagram spójności niejawnych wskazówek.

Niejawne sygnały i opinie

Antropomorfizm może manifestować się na różne sposoby, od rzeczywistej wizualnej reprezentacji agenta do głosu, dźwięków, wzorców światła, odbijania kształtów, a nawet drgań urządzenia. Podczas definiowania persony skorzystaj z niejawnych wskazówek i wzorców opinii, zamiast dążyć do bardzo ludzkiego awatara. Jest to jeden ze sposobów zminimalizowania potrzeby bardziej wyraźnego ujawnienia.

Diagram wizualnych wskazówek i informacji zwrotnej.
Te sygnały pomagają antropomorfizować agenta bez bycia zbyt ludzkim. Mogą one również stać się skutecznymi mechanizmami ujawniania informacji na własną rękę, gdy będą używane spójnie w miarę upływu czasu.

Podczas dołączania następujących typów wskazówek należy wziąć pod uwagę różne tryby interakcji twoich doświadczeń:

Kategoria Przykłady
Wskazówki wizualne
  • Avatar
  • Dynamiczne sygnały czasu rzeczywistego (np. animacje)
  • Nieekranowe sygnały (np. światła i wzorce na urządzeniu)
Wskazówki słuchowe
  • Sonicon (np. krótki charakterystyczny dźwięk, seria nut muzycznych)
Haptyczne sygnały
  • Wibracji

Ujawnienie możliwości

Ujawnienie można osiągnąć niejawnie, ustawiając dokładne oczekiwania dotyczące możliwości asystenta cyfrowego. Udostępnij przykładowe polecenia, aby użytkownicy mogli nauczyć się, jak korzystać z asystenta cyfrowego i oferują pomoc kontekstową do nauki więcej na temat syntetycznego głosu we wczesnych etapach doświadczenia.

Diagram przykładowych odpowiedzi domyślnych na konwersację, którą można utworzyć.

Przezroczystość konwersacji

Gdy konwersacje spadają w nieoczekiwanych ścieżkach, rozważ utworzenie domyślnych odpowiedzi, które mogą pomóc zresetować oczekiwania, wzmocnić przejrzystość i kierować użytkowników w kierunku udanych ścieżek. Istnieją również możliwości korzystania z otwartości w konwersacji.

Diagram przedstawiający obsługę nieoczekiwanych ścieżek.
Pytania niezwiązane z zadaniem lub "osobiste", skierowane do agenta, są dobrą okazją, aby przypomnieć użytkownikom o syntetycznym charakterze agenta i zachęcić ich do odpowiedniego zaangażowania lub przekierować do rzeczywistej osoby.

Diagram przedstawiający obsługę pytań odbiegających od zadania.

Kiedy ujawnić

Istnieje wiele możliwości ujawnienia informacji w trakcie podróży użytkownika. Projektowanie dla pierwszego użycia, drugiego użycia, kolejnych użyć…, ale także uwzględnia momenty "niepowodzeń", aby podkreślić przejrzystość — tak jak w przypadku, gdy system popełnia błąd lub gdy użytkownik wykrywa ograniczenie możliwości agenta.

Diagram możliwości ujawnienia w trakcie podróży użytkownika.
Przykład standardowej podróży użytkownika asystenta cyfrowego z różnymi możliwościami ujawniania informacji.

Z góry

Optymalny moment ujawnienia jest pierwszym razem, gdy osoba wchodzi w interakcję z syntetycznym głosem.  W scenariuszu osobistego asystenta głosowego byłoby to podczas inicjacji lub gdy użytkownik po raz pierwszy wirtualnie doświadcza środowiska. W innych scenariuszach może to być pierwszy raz, gdy syntetyczny głos odczytuje zawartość w witrynie internetowej lub po raz pierwszy użytkownik wchodzi w interakcję z znakiem wirtualnym.

Na życzenie

Użytkownicy powinni mieć możliwość łatwego uzyskiwania dostępu do dodatkowych informacji, kontrolowania preferencji i odbierania przezroczystej komunikacji w dowolnym momencie podczas podróży użytkownika po żądaniu.

Ciągle

Używaj niejawnych wzorców projektowych, które stale ulepszają środowisko użytkownika.

Gdy system ulegnie awarii

Wykorzystaj ujawnienie jako okazję, aby ponieść porażkę z wdziękiem.

Dodatkowe zasoby

Zobacz też