Schnellstart: Sprechen mit Chatmodellen und Hören von Antworten im Chat-Playground von Azure KI Studio
Geben Sie Ihrer App die Möglichkeit, zu hören und zu sprechen, indem Sie den Azure OpenAI Service mit Azure KI Speech koppeln, um umfangreichere Interaktionen zu ermöglichen.
In diesem Schnellstart verwenden Sie Azure OpenAI Service und Azure KI Speech für Folgendes:
- Sprechen mit dem Assistenten mithilfe von Sprache-in-Text
- Hören der Antwort des Assistenten mithilfe von Text-zu-Sprache
Die Sprache-in-Text- und Text-zu-Sprache-Features können zusammen oder separat im Chat-Playground von KI Studio verwendet werden. Sie können den Playground verwenden, um Ihr Chatmodell vor dem Bereitstellen zu testen.
Voraussetzungen
- Azure-Abonnement – kostenloses Abonnement erstellen.
- Ein KI Studio-Projekt.
- Ein bereitgestelltes Azure OpenAI-Chatmodell. Dieses Handbuch wird mit einem
gpt-4
-Modell getestet.
Konfigurieren des Chat-Playgrounds
Bevor Sie eine Chatsitzung starten können, müssen Sie den Chat-Playground für die Verwendung der Sprache-in-Text- und Text-zu-Sprache-Features konfigurieren.
Melden Sie sich beim Azure KI Studio an.
Wechseln Sie zu Ihrem Projekt oder erstellen Sie ein neues Projekt in Azure KI Studio.
Wählen Sie Chat aus der Liste der Playgrounds aus.
Wählen Sie ihr bereitgestelltes Chatmodell aus der Dropdownliste Bereitstellung aus.
Wählen Sie die Schaltfläche Chatfunktionen aus.
Hinweis
Ihnen sollten außerdem die Optionen zum Auswählen der Mikrofon- oder Lautsprecherschaltflächen angezeigt werden. Wenn Sie eine dieser Schaltflächen auswählen, aber Sprache-in-Text oder Text-zu-Sprache noch nicht aktiviert haben, werden Sie aufgefordert, sie in den Chatfunktionen zu aktivieren.
Aktivieren Sie auf der Seite Chatfunktionen das Kontrollkästchen, um zu bestätigen, dass die Verwendung des Sprachfeatures zusätzliche Kosten verursacht. Weitere Informationen finden Sie unter Azure KI Speech – Preise.
Wählen Sie Sprache-in-Text aktivieren und Text-zu-Sprache aktivieren aus.
Wählen Sie das Gebietsschema der Sprache und die Stimme aus, die Sie zum Sprechen und Hören verwenden möchten. Die Liste der verfügbaren Stimmen hängt vom ausgewählten Gebietsschema ab.
Optional können Sie die Stimme ausprobieren, bevor Sie zur Chatsitzung zurückkehren. Geben Sie Beispieltext ein, und wählen Sie Wiedergabe aus
Wählen Sie Speichern.
Starten einer Chat-Sitzung
In dieser Chatsitzung verwenden Sie sowohl Sprache-in-Text als auch Text-zu-Sprache. Sie verwenden das Text-zu-Sprache-Feature, um mit dem Assistenten zu sprechen, und das Sprache-in-Text-Feature, um seine Antwort zu hören.
Führen Sie die Schritte im Abschnitt Konfigurieren des Playgrounds aus, falls Sie dies noch nicht getan haben. Um diesen Schnellstart abzuschließen, müssen Sie die Sprache-in-Text- und Text-zu-Sprache-Features aktivieren.
Wählen Sie die Mikrofonschaltfläche aus, und sprechen Sie mit dem Assistenten. Sie können beispielsweise sagen: „Weißt du, wo ich eine Xbox bekommen kann?“
Wählen Sie die Schaltfläche „Senden“ (Pfeil nach rechts) aus, um Ihre Nachricht an den Assistenten zu senden. Die Antwort des Assistenten wird im Chatsitzungsbereich angezeigt.
Hinweis
Wenn die Lautsprecherschaltfläche aktiviert ist, hören Sie die Antwort des Assistenten. Wenn die Lautsprecherschaltfläche deaktiviert ist, hören Sie die Antwort des Assistenten nicht, die Antwort wird aber trotzdem im Chatsitzungsbereich angezeigt.
Sie können den Prompt des Systems ändern, um das Antwortformat oder den Stil des Assistenten zu ändern.
Geben Sie z. B. Folgendes ein:
"You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
Die Antwort wird im Chatsitzungsbereich angezeigt. Da die Lautsprecherschaltfläche aktiviert ist, können Sie auch die Antwort des Assistenten hören.
Beispielcode anzeigen
Sie können die Schaltfläche Code anzeigen auswählen, um den Beispielcode anzuzeigen und zu kopieren, der die Konfiguration für die Azure OpenAI- und Azure KI Speech-Dienste enthält.
Sie können den Beispielcode verwenden, um Sprache-in-Text und Text-zu-Sprache in Ihrer Anwendung zu aktivieren.
Tipp
Ein weiteres Beispiel finden Sie im Sprache-zu-Sprache-Chat-Codebeispiel.
Bereinigen von Ressourcen
Um unnötige Azure-Kosten zu vermeiden, sollten Sie die in diesem Schnellstart erstellten Ressourcen löschen, wenn sie nicht mehr benötigt werden. Zum Verwalten von Ressourcen können Sie das Azure-Portal verwenden.