Sprachbefehle

Bei Der Verwendung von Sprachbefehlen wird der Blick normalerweise als Zielmechanismus verwendet, ob als Zeiger ("auswählen") oder um Ihren Befehl an eine Anwendung zu leiten ("sehen Sie es, sagen Sie es"). Natürlich benötigen einige Sprachbefehle kein Ziel, wie „Zum Startmenü“ oder „Hey Cortana“.

Geräteunterstützung

Feature HoloLens (1. Generation) HoloLens 2 Immersive Headsets
Sprachbefehle ✔️ ✔️ ✔️ (mit angeschlossenem Headset)

Verwendung der Spracheingabe

Erwägen Sie, Sprachbefehle zu jeder von Ihnen erstellten Umgebung hinzuzufügen. Voice ist eine leistungsstarke und bequeme Möglichkeit, das System und die Apps zu steuern. Da Benutzer mit einer Vielzahl von Dialekten und Akzenten sprechen, stellt die richtige Auswahl der Schlüsselwörter für die Spracherkennung sicher, dass die Befehle Ihrer Benutzer eindeutig interpretiert werden.

Bewährte Methoden

Nachfolgend finden Sie einige Methoden aufgeführt, die eine reibungslose Spracherkennung ermöglichen.

  • Präzise Befehle verwenden: Wählen Sie nach Möglichkeit Schlüsselwörter mit zwei oder mehr Silben aus. Einsilbige Wörter neigen dazu, unterschiedliche Vokallaute zu verwenden, wenn sie von Personen mit unterschiedlichen Akzenten gesprochen werden. Beispiel: "Video wiedergeben" ist besser als "Aktuell ausgewähltes Video wiedergeben"
  • Einfaches Vokabular verwenden - Beispiel: "Notiz anzeigen" ist besser als "Placard anzeigen"
  • Sicherstellen, dass Befehle nicht destruktiv sind: Stellen Sie sicher, dass alle Aktionen, die von einem Spracherkennungsbefehl ausgeführt werden können, nicht destruktiv sind und leicht rückgängig gemacht werden können, falls eine andere Person, die in der Nähe des Benutzers spricht, versehentlich einen Befehl auslöst.
  • Ähnlich klingende Befehle vermeiden: Vermeiden Sie es, mehrere Spracherkennungsbefehle zu registrieren, die sehr ähnlich klingen. Beispiel: "Mehr anzeigen" und "Store anzeigen" können sehr ähnlich klingen.
  • Registrierung der App aufheben, wenn sie nicht verwendet wird: Wenn sich Ihre Anwendung nicht in einem Zustand befindet, in dem ein bestimmter Sprachbefehl gültig ist, sollten Sie die Registrierung der App aufheben, damit andere Befehle nicht mit diesem verwechselt werden.
  • Mit verschiedenen Akzenten testen: Testen Sie Ihre App mit Benutzern, die unterschiedliche Akzente verwenden.
  • Konsistenz von Sprachbefehlen beibehalten: Wenn „Zurück“ zur vorherigen Seite wechselt, übernehmen Sie dieses Verhalten in Ihren Anwendungen.
  • Verwendung von Systembefehlen vermeiden: Die folgenden Sprachbefehle sind für das System reserviert. Diese sollten nicht von Anwendungen verwendet werden.
    • „Hey Cortana“
    • „Auswählen“

„Auswählen“

Wenn Sie zu einem beliebigen Zeitpunkt „Auswählen“ sagen, wird das aktiviert, worauf der beim Anvisieren verwendete Cursor zeigt.

Hinweis: In HoloLens 2 muss der Blickcursor zuerst aufgerufen werden, indem das Wort "auswählen" angegeben wird. Sagen Sie erneut "auswählen", um sie zu aktivieren. Um den Blickcursor auszublenden, verwenden Sie einfach Ihre Hände, um ein Objekt zu airtapen oder zu berühren.

Sehen, sagen

Windows Mixed Reality hat ein „Sehen, sagen“-Sprachmodell eingesetzt, bei dem Beschriftungen auf Schaltflächen mit den zugehörigen Sprachbefehlen identisch sind. Da es keine Missverständnisse zwischen Beschriftung und Sprachbefehl gibt, können Benutzer besser verstehen, was sie sagen müssen, um das System zu steuern. Um dies zu verstärken, wird beim Verweilen auf einer Schaltfläche ein Tipp zum Verweilen angezeigt, um mitzuteilen, welche Schaltflächen sprachaktiviert sind.

See it say it example 1

See it say it example 2
Beispiele für „Sehen, sagen“

Vorteile der Spracheingabe

Die Spracheingabe ist eine natürliche Art, unsere Absichten zu kommunizieren. Voice ist besonders gut bei Schnittstellendurchgängen , da benutzer beim Durchschneiden mehrerer Schritte einer Schnittstelle helfen können (ein Benutzer kann "zurück" sagen, während eine Webseite betrachtet wird, anstatt die Schaltfläche "Zurück" in der App zu öffnen und auf die Schaltfläche "Zurück" zu klicken). Diese geringe Zeitersparnis hat einen starken emotionalen Effekt auf die Wahrnehmung der Erfahrung eines Benutzers und gibt ihnen eine kleine Menge Superpower. Die Verwendung von Stimme ist auch eine bequeme Eingabemethode, wenn wir unsere Arme voll haben oder multiaufgabenweise sind. Auf Geräten, auf denen die Eingabe einer Tastatur schwierig ist, kann die Sprach-Diktatfunktion eine effiziente, alternative Möglichkeit zur Eingabe sein. Schließlich ist Voice in einigen Fällen, wenn der Bereich der Genauigkeit für Blick und Geste begrenzt ist, möglicherweise die einzige vertrauenswürdige Methode der Eingabe eines Benutzers.

Vorteile der Spracheingabe für den Benutzer

  • Verkürzt den Zeitaufwand – das Endziel sollte effizienter erreicht werden.
  • Minimiert den Aufwand – Aufgaben sollten flüssiger und müheloser verlaufen.
  • Reduziert die kognitive Belastung – sie ist intuitiv, leicht zu erlernen und zu merken.
  • Sie ist sozialverträglich – sie sollte sich in Bezug auf das Verhalten in die gesellschaftlichen Normen einfügen.
  • Sie stellt eine Routine dar – die Spracheingabe kann leicht zu einem gewohnheitsmäßigen Verhalten werden.

Nachteile der Spracheingabe

Die Spracheingabe weist auch einige Schwächen auf. Eine davon ist die differenzierte Steuerung. (Beispielsweise könnte ein Benutzer "lauter" sagen, aber kann nicht sagen, wie viel. „Etwas“ ist schwer zu quantifizieren. Das Bewegen oder Skalieren von Objekten per Spracheingabe ist ebenfalls schwierig (die Spracheingabe bietet nicht die Genauigkeit bei der Steuerung). Die Spracheingabe kann auch unvollkommen sein. Gelegentlich hört ein Spracheingabesystem einen Befehl falsch oder überhaupt nicht. Die Wiederherstellung nach solchen Fehlern stellt für jede Schnittstelle eine Herausforderung dar. Schließlich ist die Spracheingabe an öffentlichen Orten möglicherweise nicht gesellschaftsfähig. Es gibt einige Dinge, die Benutzer nicht sagen können oder sollten. Diese Hindernisse ermöglichen es, die Spracherkennung dafür zu nutzen, wofür sie am besten geeignet ist.

Statusangaben für Spracherkennungsfeedback

Wenn die Spracherkennung richtig angewendet wird, versteht der Benutzer, was er sagen kann und er erhält ein eindeutiges Feedback, das das System ihn richtig verstanden hat. Diese beiden Signale geben dem Benutzer das Gefühl, dass er die Spracherkennung als primäre Eingabemethode verwenden kann. Nachfolgend ist in einem Diagramm dargestellt, was mit dem Cursor geschieht, wenn die Spracheingabe erkannt wird und wie dies dem Benutzer vermittelt wird.

Voice feedback states for cursor
Statusangaben für Spracherkennungsfeedback für Cursor

Wichtige Informationen zur Spracherkennung in Mixed Reality

  • Sagen Sie „Auswählen“, während Sie eine Schaltfläche anvisieren (Sie können dies überall verwenden, um auf eine Schaltfläche zu klicken).
  • Sie können in einigen Apps den Bezeichnungsnamen einer Schaltfläche auf der App-Leiste sagen, um eine Aktion auszuführen. Beim Betrachten einer App kann ein Benutzer z. B. den Befehl „Entfernen“ sagen, um die App aus der Umgebung zu entfernen (das spart Zeit, da die App nicht mit der Hand angeklickt werden muss).
  • Sie können Cortana Zuhören initiieren, indem Sie "Hey Cortana" sagen. Sie können ihre Fragen stellen ("Hey Cortana, wie hoch ist der Eiffelturm?"), sagen Sie ihr, eine App ("Hey Cortana, Netflix öffnen") zu öffnen oder sie zu informieren, das Startmenü ("Hey Cortana, zu Hause zu bringen") und vieles mehr.

Häufig gestellte Fragen und Bedenken von Benutzern zur Spracheingabe

  • Was kann ich sagen?
  • Woher weiß ich, ob das System mich richtig verstanden hat?
    • Das System versteht meine Sprachbefehle immer wieder falsch.
    • Es reagiert nicht, wenn ich einen Sprachbefehl erteile.
  • Es reagiert falsch, wenn ich einen Sprachbefehl erteile.
  • Wie richte ich meine Stimme auf eine bestimmte App oder einen bestimmten App-Befehl aus?
  • Kann ich Objekte per Sprachbefehl aus dem holografischen Rahmen der HoloLens bewegen?

Siehe auch