Die erforderlichen Erweiterungen bereitstellen

5 Minuten

Das grundlegende Verhalten eines sprachaktivierten Microsoft Copilot Studio-Agents unterscheidet sich weitgehend nicht von einem herkömmlichen Agent. Aus Designperspektive müssen Sie beim Erstellen des Agents nichts anders machen. Elemente wie Themen, Entitäten und andere Elemente werden auf die gleiche Weise entworfen. Der Hauptunterschied besteht darin, dass der Agent nicht per Text mit einem Kunden interagiert, sondern über Sprache mit ihm kommuniziert. Damit dieser Prozess erwartungsgemäß abläuft, müssen Sie mehrere Erweiterungen in Ihrer Umgebung installieren, sodass alles korrekt gehandhabt wird.

Sie müssen einige Einstellungen vornehmen, um Ihren Agent für Sprachfunktionen einzurichten. Sie finden alle Spracheinstellungen unter Einstellungen>Sprache. Ihr Agent ist zunächst nicht für die Sprachausführung optimiert. Durch Auswahl von Für Sprache optimieren werden zusätzliche Sprachfunktionen verfügbar.

Nachdem Sie Für Sprache optimieren aktiviert haben, können Sie die folgenden Einstellungen aktualisieren:

Sprache als primären Authoringmodus verwenden:
Genauigkeit mit Agent-Daten erhöhen: Sie können Ihrem Spracherkennungsmodell sprachspezifische Daten basierend auf den Inhalten Ihres Agents hinzufügen. Dadurch erhöht sich die Zeit, die zum Veröffentlichen Ihres Agents benötigt wird.
Timeouts:
- MFV: Enthält verschiedene Einstellungen, mit deren Hilfe definiert wird, wie der Agent Eingaben von einer Wähltastatur empfängt. Es müssen zwei Einstellungen geändert werden:
  - Zeitüberschreitung zwischen Ziffern: Dieses Zeitüberschreitungslimit greift, wenn der Benutzer die maximale Eingabelänge nicht erreicht hat. Dies gilt nur für mehrstellige DTMF-Eingaben.
  - Zeitüberschreitung für Beenden: Dieses Zeitüberschreitungslimit greift, wenn der Benutzer die maximale Eingabelänge erreicht hat und die Beendentaste nicht gedrückt hat. Dies gilt nur für mehrstellige DTMF-Eingaben.
- Erkennung von Stille: Sie können festlegen, wie Ihr Agent reagieren soll, wenn er keine Eingabe vom Endbenutzer erkennt. Die Einstellung ist binär und kann entweder aktiviert oder deaktiviert werden.
- Spracherfassung: Sie können Limits dafür festlegen, wie lange Ihr Agent versucht, Eingabedaten zu erkennen und zu erfassen. Dazu gehören die folgenden Einstellungen:
  - Zeitüberschreitung am Ende der Äußerung: Dieses Zeitüberschreitungslimit greift, wenn der Benutzer während oder nach dem Sprechen eine Pause macht. Wenn die Pause das Zeitüberschreitungslimit überschreitet, verhält sich der Agent so, als ob der Benutzer zu Ende gesprochen hätte.
  - Zeitüberschreitung für Spracherkennung: Dieses Zeitüberschreitungslimit legt fest, wie viel Zeit der Agent Benutzenden für ihre Eingaben einräumt, nachdem diese zu sprechen beginnen.
- Latenzmeldungen: Hier können Sie auswählen, wie und wann Benutzende eine Latenzmeldung hören, wenn Hintergrundvorgänge länger als erwartet dauern. Dazu gehören die folgenden Einstellungen:
  - Verzögerung beim Senden von Nachrichten: Diese Einstellung legt fest, wie lange der Agent nach dem Starten einer Hintergrundvorgangsanforderung warten soll, bevor er die Latenzmeldung übermittelt.
  - Minimale Wiedergabezeit: Die Latenzmeldung wird mindestens für diese Zeit wiedergegeben, auch wenn der Hintergrundvorgang während der Wiedergabe der Meldung abgeschlossen wird.
- Sprachempfindlichkeit: Steuert die Sprachempfindlichkeit. Niedrigere Einstellungen filtern mehr Hintergrundgeräusche heraus. Höhere Einstellungen eignen sich am besten für ruhige Umgebungen.

Feedback

War diese Seite hilfreich?