Szybki start: posłuchaj modeli czatów i porozmawiaj z nimi na placu zabaw czatu w usłudze AI Studio

Ważne

Niektóre funkcje opisane w tym artykule mogą być dostępne tylko w wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie zalecamy korzystania z niej w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.

Daj aplikacji możliwość słuchania i mówienia przez parowanie usługi Azure OpenAI Service z usługą Azure AI Speech w celu umożliwienia bogatszych interakcji.

W tym przewodniku Szybki start użyjesz usługi Azure OpenAI Service i usługi Azure AI Speech do:

  • Porozmawiaj z asystentem za pośrednictwem mowy na tekst.
  • Posłuchaj odpowiedzi asystenta za pomocą tekstu na mowę.

Funkcje zamiany mowy na tekst i tekst na mowę mogą być używane razem lub oddzielnie na placu zabaw czatu AI Studio. Za pomocą placu zabaw można przetestować model czatu przed jego wdrożeniem.

Wymagania wstępne

  • Subskrypcja platformy Azure — utwórz bezpłatnie.

  • Dostęp jest udzielany usłudze Azure OpenAI w żądanej subskrypcji platformy Azure.

    Obecnie dostęp do tej usługi jest udzielany tylko przez aplikację. Możesz ubiegać się o dostęp do usługi Azure OpenAI, wypełniając formularz pod adresem https://aka.ms/oai/access. Otwórz problem w tym repozytorium, aby skontaktować się z nami, jeśli masz problem.

  • Centrum AI Studio z wdrożonym modelem czatu. Aby uzyskać więcej informacji na temat modeli wdrażania, zobacz przewodnik po modelach wdrażania).

  • Projekt AI Studio.

Konfigurowanie placu zabaw czatu

Przed rozpoczęciem sesji czatu należy skonfigurować plac zabaw czatu, aby używać mowy do zamiany tekstu i tekstu na funkcje mowy.

  1. Zaloguj się do usługi Azure AI Studio.

  2. Przejdź do projektu lub utwórz nowy projekt w usłudze Azure AI Studio.

  3. Wybierz pozycję Chat na placu zabaw>w okienku po lewej stronie.

  4. Wybierz wdrożony model czatu z listy rozwijanej Wdrożenie .

    Zrzut ekranu przedstawiający plac zabaw czatu z wyróżnionym trybem i wdrożeniem.

  5. Wybierz przycisk Ustawienia placu zabaw.

    Zrzut ekranu przedstawiający plac zabaw czatu z opcjami, aby przejść do ustawień placu zabaw.

    Uwaga

    Powinny zostać również wyświetlone opcje wybierania przycisków mikrofonu lub głośnika. Jeśli wybierzesz jeden z tych przycisków, ale nie włączono jeszcze mowy na tekst lub zamianę tekstu na mowę, zostanie wyświetlony monit o włączenie ich w ustawieniach placu zabaw.

  6. Na stronie Plac zabaw Ustawienia zaznacz pole, aby potwierdzić, że użycie funkcji mowy spowoduje naliczenie dodatkowych kosztów. Aby uzyskać więcej informacji, zobacz Cennik usługi Azure AI Speech.

  7. Wybierz pozycję Włącz zamianę mowy na tekst i Włącz zamianę tekstu na mowę.

    Zrzut ekranu przedstawiający stronę ustawień placu zabaw.

  8. Wybierz ustawienia regionalne języka i głos, którego chcesz użyć do mówienia i słuchu. Lista dostępnych głosów zależy od wybranych ustawień regionalnych.

    Zrzut ekranu przedstawiający stronę ustawień placu zabaw z wybranym głosem, który mówi po japońsku.

  9. Opcjonalnie możesz wprowadzić przykładowy tekst i wybrać pozycję Odtwórz , aby wypróbować głos.

  10. Wybierz pozycję Zapisz.

Rozpoczynanie sesji czatu

W tej sesji czatu używasz zarówno mowy do zamiany tekstu, jak i tekstu na mowę. Funkcja zamiany mowy na tekst umożliwia rozmowę z asystentem oraz funkcję zamiany tekstu na mowę, aby usłyszeć odpowiedź asystenta.

  1. Jeśli jeszcze tego nie zrobiono, wykonaj kroki opisane w sekcji Konfigurowanie placu zabaw . Aby ukończyć ten przewodnik Szybki start, musisz włączyć zamianę mowy na tekst i tekst na funkcje mowy.

  2. Wybierz przycisk mikrofonu i porozmawiaj z asystentem. Możesz na przykład powiedzieć "Czy wiesz, gdzie mogę uzyskać konsolę Xbox".

    Zrzut ekranu przedstawiający sesję czatu z wyróżnioną ikoną włączonego mikrofonu i przyciskiem wyślij.

  3. Wybierz przycisk wysyłania (strzałka w prawo), aby wysłać wiadomość do asystenta. Odpowiedź asystenta jest wyświetlana w okienku sesji czatu.

    Zrzut ekranu przedstawiający sesję czatu z odpowiedzią asystenta.

    Uwaga

    Jeśli przycisk osoby mówiącej jest włączony, usłyszysz odpowiedź asystenta. Jeśli przycisk osoby mówiącej jest wyłączony, nie usłyszysz odpowiedzi asystenta, ale odpowiedź będzie nadal wyświetlana w okienku sesji czatu.

  4. Możesz zmienić monit systemowy, aby zmienić format odpowiedzi lub styl asystenta.

    Na przykład wprowadź:

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    Odpowiedź jest wyświetlana w okienku sesji czatu. Ponieważ przycisk głośnika jest włączony, możesz również usłyszeć odpowiedź.

    Zrzut ekranu przedstawiający sesję czatu z wyświetlonym monitem systemowym.

Wyświetlanie przykładowego kodu

Możesz wybrać przycisk Wyświetl kod , aby wyświetlić i skopiować przykładowy kod, który obejmuje konfigurację usług Azure OpenAI i Speech.

Zrzut ekranu przedstawiający przycisk, aby wyświetlić przykładowy kod na placu zabaw.

Przykładowy kod umożliwia zamianę mowy na tekst i tekst na mowę w aplikacji.

Zrzut ekranu przedstawiający wyświetlanie kodu na placu zabaw.

Napiwek

Aby zapoznać się z innym przykładem, zobacz przykładowy kod rozmowy mowy na mowę.

Czyszczenie zasobów

Aby uniknąć ponoszenia niepotrzebnych kosztów platformy Azure, usuń zasoby utworzone w tym przewodniku Szybki start, jeśli nie są już potrzebne. Aby zarządzać zasobami, możesz użyć witryny Azure Portal.

Następne kroki