Udostępnij za pośrednictwem


Szybki start: posłuchaj modeli czatów i porozmawiaj z nimi na placu zabaw czatu w usłudze AI Studio

Daj aplikacji możliwość słuchania i mówienia przez parowanie usługi Azure OpenAI Service z usługą Azure AI Speech w celu umożliwienia bogatszych interakcji.

W tym przewodniku Szybki start użyjesz usługi Azure OpenAI Service i usługi Azure AI Speech do:

  • Porozmawiaj z asystentem za pośrednictwem mowy na tekst.
  • Posłuchaj odpowiedzi asystenta za pomocą tekstu na mowę.

Funkcje zamiany mowy na tekst i tekst na mowę mogą być używane razem lub oddzielnie na placu zabaw czatu AI Studio. Za pomocą placu zabaw można przetestować model czatu przed jego wdrożeniem.

Wymagania wstępne

Konfigurowanie placu zabaw czatu

Przed rozpoczęciem sesji czatu należy skonfigurować plac zabaw czatu, aby używać mowy do zamiany tekstu i tekstu na funkcje mowy.

  1. Zaloguj się do usługi Azure AI Studio.

  2. Przejdź do projektu lub utwórz nowy projekt w usłudze Azure AI Studio.

  3. Wybierz pozycję Czat z listy placów zabaw.

  4. Wybierz wdrożony model czatu z listy rozwijanej Wdrożenie .

    Zrzut ekranu przedstawiający plac zabaw czatu z wyróżnionym trybem i wdrożeniem.

  5. Wybierz przycisk Możliwości czatu.

    Zrzut ekranu przedstawiający plac zabaw czatu z opcjami umożliwiającymi dostęp do ustawień możliwości czatu.

    Uwaga

    Powinny zostać również wyświetlone opcje wybierania przycisków mikrofonu lub głośnika. W przypadku wybrania jednego z tych przycisków, ale jeszcze nie włączono zamiany mowy na tekst lub zamianę tekstu na mowę, zostanie wyświetlony monit o włączenie ich w funkcjach czatu.

  6. Na stronie Możliwości czatu wybierz pole, aby potwierdzić, że użycie funkcji mowy spowoduje naliczanie dodatkowych kosztów. Aby uzyskać więcej informacji, zobacz Cennik usługi Azure AI Speech.

  7. Wybierz pozycję Włącz zamianę mowy na tekst i Włącz zamianę tekstu na mowę.

    Zrzut ekranu przedstawiający stronę możliwości czatu.

  8. Wybierz ustawienia regionalne języka i głos, którego chcesz użyć do mówienia i słuchu. Lista dostępnych głosów zależy od wybranych ustawień regionalnych.

  9. Opcjonalnie możesz wypróbować głos przed powrotem do sesji czatu. Wprowadź przykładowy tekst i wybierz pozycję Odtwórz, aby

  10. Wybierz pozycję Zapisz.

Rozpoczynanie sesji czatu

W tej sesji czatu używasz zarówno mowy do zamiany tekstu, jak i tekstu na mowę. Funkcja zamiany mowy na tekst umożliwia rozmowę z asystentem oraz funkcję zamiany tekstu na mowę, aby usłyszeć odpowiedź asystenta.

  1. Jeśli jeszcze tego nie zrobiono, wykonaj kroki opisane w sekcji Konfigurowanie placu zabaw . Aby ukończyć ten przewodnik Szybki start, musisz włączyć zamianę mowy na tekst i tekst na funkcje mowy.

  2. Wybierz przycisk mikrofonu i porozmawiaj z asystentem. Możesz na przykład powiedzieć "Czy wiesz, gdzie mogę uzyskać konsolę Xbox".

    Zrzut ekranu przedstawiający sesję czatu z wyróżnioną ikoną włączonego mikrofonu i przyciskiem wyślij.

  3. Wybierz przycisk wysyłania (strzałka w prawo), aby wysłać wiadomość do asystenta. Odpowiedź asystenta jest wyświetlana w okienku sesji czatu.

    Zrzut ekranu przedstawiający sesję czatu z odpowiedzią asystenta.

    Uwaga

    Jeśli przycisk osoby mówiącej jest włączony, usłyszysz odpowiedź asystenta. Jeśli przycisk osoby mówiącej jest wyłączony, nie usłyszysz odpowiedzi asystenta, ale odpowiedź będzie nadal wyświetlana w okienku sesji czatu.

  4. Możesz zmienić monit systemowy, aby zmienić format odpowiedzi lub styl asystenta.

    Na przykład wprowadź:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    Odpowiedź jest wyświetlana w okienku sesji czatu. Ponieważ przycisk głośnika jest włączony, możesz również usłyszeć odpowiedź.

    Zrzut ekranu przedstawiający sesję czatu z wyświetlonym monitem systemowym.

Wyświetlanie przykładowego kodu

Możesz wybrać przycisk Wyświetl kod , aby wyświetlić i skopiować przykładowy kod, który obejmuje konfigurację usług Azure OpenAI i Speech.

Zrzut ekranu przedstawiający przycisk, aby wyświetlić przykładowy kod na placu zabaw.

Przykładowy kod umożliwia zamianę mowy na tekst i tekst na mowę w aplikacji.

Zrzut ekranu przedstawiający wyświetlanie kodu na placu zabaw.

Napiwek

Aby zapoznać się z innym przykładem, zobacz przykładowy kod rozmowy mowy na mowę.

Czyszczenie zasobów

Aby uniknąć ponoszenia niepotrzebnych kosztów platformy Azure, usuń zasoby utworzone w tym przewodniku Szybki start, jeśli nie są już potrzebne. Aby zarządzać zasobami, możesz użyć witryny Azure Portal.

Następne kroki