Teilen über


Schnellstart: Sprechen mit Chatmodellen und Hören von Antworten im Chat-Playground von Azure KI Studio

Geben Sie Ihrer App die Möglichkeit, zu hören und zu sprechen, indem Sie den Azure OpenAI Service mit Azure KI Speech koppeln, um umfangreichere Interaktionen zu ermöglichen.

In diesem Schnellstart verwenden Sie Azure OpenAI Service und Azure KI Speech für Folgendes:

  • Sprechen mit dem Assistenten mithilfe von Sprache-in-Text
  • Hören der Antwort des Assistenten mithilfe von Text-zu-Sprache

Die Sprache-in-Text- und Text-zu-Sprache-Features können zusammen oder separat im Chat-Playground von KI Studio verwendet werden. Sie können den Playground verwenden, um Ihr Chatmodell vor dem Bereitstellen zu testen.

Voraussetzungen

Konfigurieren des Chat-Playgrounds

Bevor Sie eine Chatsitzung starten können, müssen Sie den Chat-Playground für die Verwendung der Sprache-in-Text- und Text-zu-Sprache-Features konfigurieren.

  1. Melden Sie sich beim Azure KI Studio an.

  2. Wechseln Sie zu Ihrem Projekt oder erstellen Sie ein neues Projekt in Azure KI Studio.

  3. Wählen Sie Chat aus der Liste der Playgrounds aus.

  4. Wählen Sie ihr bereitgestelltes Chatmodell aus der Dropdownliste Bereitstellung aus.

    Screenshot des Chat-Playgrounds mit hervorgehobener Option

  5. Wählen Sie die Schaltfläche Chatfunktionen aus.

    Screenshot des Chat-Playgrounds mit Optionen, um zu den Einstellungen für die Chatfunktionen zu gelangen.

    Hinweis

    Ihnen sollten außerdem die Optionen zum Auswählen der Mikrofon- oder Lautsprecherschaltflächen angezeigt werden. Wenn Sie eine dieser Schaltflächen auswählen, aber Sprache-in-Text oder Text-zu-Sprache noch nicht aktiviert haben, werden Sie aufgefordert, sie in den Chatfunktionen zu aktivieren.

  6. Aktivieren Sie auf der Seite Chatfunktionen das Kontrollkästchen, um zu bestätigen, dass die Verwendung des Sprachfeatures zusätzliche Kosten verursacht. Weitere Informationen finden Sie unter Azure KI Speech – Preise.

  7. Wählen Sie Sprache-in-Text aktivieren und Text-zu-Sprache aktivieren aus.

    Screenshot der Seite „Chatfunktionen“.

  8. Wählen Sie das Gebietsschema der Sprache und die Stimme aus, die Sie zum Sprechen und Hören verwenden möchten. Die Liste der verfügbaren Stimmen hängt vom ausgewählten Gebietsschema ab.

  9. Optional können Sie die Stimme ausprobieren, bevor Sie zur Chatsitzung zurückkehren. Geben Sie Beispieltext ein, und wählen Sie Wiedergabe aus

  10. Wählen Sie Speichern.

Starten einer Chat-Sitzung

In dieser Chatsitzung verwenden Sie sowohl Sprache-in-Text als auch Text-zu-Sprache. Sie verwenden das Text-zu-Sprache-Feature, um mit dem Assistenten zu sprechen, und das Sprache-in-Text-Feature, um seine Antwort zu hören.

  1. Führen Sie die Schritte im Abschnitt Konfigurieren des Playgrounds aus, falls Sie dies noch nicht getan haben. Um diesen Schnellstart abzuschließen, müssen Sie die Sprache-in-Text- und Text-zu-Sprache-Features aktivieren.

  2. Wählen Sie die Mikrofonschaltfläche aus, und sprechen Sie mit dem Assistenten. Sie können beispielsweise sagen: „Weißt du, wo ich eine Xbox bekommen kann?“

    Screenshot der Chatsitzung mit aktivierten Mikrofonsymbol und hervorgehobener Schaltfläche

  3. Wählen Sie die Schaltfläche „Senden“ (Pfeil nach rechts) aus, um Ihre Nachricht an den Assistenten zu senden. Die Antwort des Assistenten wird im Chatsitzungsbereich angezeigt.

    Screenshot der Chatsitzung mit der Antwort des Assistenten.

    Hinweis

    Wenn die Lautsprecherschaltfläche aktiviert ist, hören Sie die Antwort des Assistenten. Wenn die Lautsprecherschaltfläche deaktiviert ist, hören Sie die Antwort des Assistenten nicht, die Antwort wird aber trotzdem im Chatsitzungsbereich angezeigt.

  4. Sie können den Prompt des Systems ändern, um das Antwortformat oder den Stil des Assistenten zu ändern.

    Geben Sie z. B. Folgendes ein:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    Die Antwort wird im Chatsitzungsbereich angezeigt. Da die Lautsprecherschaltfläche aktiviert ist, können Sie auch die Antwort des Assistenten hören.

    Screenshot der Chatsitzung mit bearbeiteter Systemaufforderung.

Beispielcode anzeigen

Sie können die Schaltfläche Code anzeigen auswählen, um den Beispielcode anzuzeigen und zu kopieren, der die Konfiguration für die Azure OpenAI- und Azure KI Speech-Dienste enthält.

Screenshot der Schaltfläche zum Anzeigen von Beispielcode im Playground

Sie können den Beispielcode verwenden, um Sprache-in-Text und Text-zu-Sprache in Ihrer Anwendung zu aktivieren.

Screenshot der Anzeige des Codes im Playground.

Tipp

Ein weiteres Beispiel finden Sie im Sprache-zu-Sprache-Chat-Codebeispiel.

Bereinigen von Ressourcen

Um unnötige Azure-Kosten zu vermeiden, sollten Sie die in diesem Schnellstart erstellten Ressourcen löschen, wenn sie nicht mehr benötigt werden. Zum Verwalten von Ressourcen können Sie das Azure-Portal verwenden.

Nächste Schritte