Szybki start: posłuchaj modeli czatów i porozmawiaj z nimi na placu zabaw czatu w usłudze AI Studio
Daj aplikacji możliwość słuchania i mówienia przez parowanie usługi Azure OpenAI Service z usługą Azure AI Speech w celu umożliwienia bogatszych interakcji.
W tym przewodniku Szybki start użyjesz usługi Azure OpenAI Service i usługi Azure AI Speech do:
- Porozmawiaj z asystentem za pośrednictwem mowy na tekst.
- Posłuchaj odpowiedzi asystenta za pomocą tekstu na mowę.
Funkcje zamiany mowy na tekst i tekst na mowę mogą być używane razem lub oddzielnie na placu zabaw czatu AI Studio. Za pomocą placu zabaw można przetestować model czatu przed jego wdrożeniem.
Wymagania wstępne
- Subskrypcja platformy Azure — utwórz bezpłatnie.
- Projekt AI Studio.
- Wdrożony model czatu usługi Azure OpenAI . Ten przewodnik jest testowany przy użyciu
gpt-4
modelu.
Konfigurowanie placu zabaw czatu
Przed rozpoczęciem sesji czatu należy skonfigurować plac zabaw czatu, aby używać mowy do zamiany tekstu i tekstu na funkcje mowy.
Zaloguj się do usługi Azure AI Studio.
Przejdź do projektu lub utwórz nowy projekt w usłudze Azure AI Studio.
Wybierz pozycję Czat z listy placów zabaw.
Wybierz wdrożony model czatu z listy rozwijanej Wdrożenie .
Wybierz przycisk Możliwości czatu.
Uwaga
Powinny zostać również wyświetlone opcje wybierania przycisków mikrofonu lub głośnika. W przypadku wybrania jednego z tych przycisków, ale jeszcze nie włączono zamiany mowy na tekst lub zamianę tekstu na mowę, zostanie wyświetlony monit o włączenie ich w funkcjach czatu.
Na stronie Możliwości czatu wybierz pole, aby potwierdzić, że użycie funkcji mowy spowoduje naliczanie dodatkowych kosztów. Aby uzyskać więcej informacji, zobacz Cennik usługi Azure AI Speech.
Wybierz pozycję Włącz zamianę mowy na tekst i Włącz zamianę tekstu na mowę.
Wybierz ustawienia regionalne języka i głos, którego chcesz użyć do mówienia i słuchu. Lista dostępnych głosów zależy od wybranych ustawień regionalnych.
Opcjonalnie możesz wypróbować głos przed powrotem do sesji czatu. Wprowadź przykładowy tekst i wybierz pozycję Odtwórz, aby
Wybierz pozycję Zapisz.
Rozpoczynanie sesji czatu
W tej sesji czatu używasz zarówno mowy do zamiany tekstu, jak i tekstu na mowę. Funkcja zamiany mowy na tekst umożliwia rozmowę z asystentem oraz funkcję zamiany tekstu na mowę, aby usłyszeć odpowiedź asystenta.
Jeśli jeszcze tego nie zrobiono, wykonaj kroki opisane w sekcji Konfigurowanie placu zabaw . Aby ukończyć ten przewodnik Szybki start, musisz włączyć zamianę mowy na tekst i tekst na funkcje mowy.
Wybierz przycisk mikrofonu i porozmawiaj z asystentem. Możesz na przykład powiedzieć "Czy wiesz, gdzie mogę uzyskać konsolę Xbox".
Wybierz przycisk wysyłania (strzałka w prawo), aby wysłać wiadomość do asystenta. Odpowiedź asystenta jest wyświetlana w okienku sesji czatu.
Uwaga
Jeśli przycisk osoby mówiącej jest włączony, usłyszysz odpowiedź asystenta. Jeśli przycisk osoby mówiącej jest wyłączony, nie usłyszysz odpowiedzi asystenta, ale odpowiedź będzie nadal wyświetlana w okienku sesji czatu.
Możesz zmienić monit systemowy, aby zmienić format odpowiedzi lub styl asystenta.
Na przykład wprowadź:
"You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
Odpowiedź jest wyświetlana w okienku sesji czatu. Ponieważ przycisk głośnika jest włączony, możesz również usłyszeć odpowiedź.
Wyświetlanie przykładowego kodu
Możesz wybrać przycisk Wyświetl kod , aby wyświetlić i skopiować przykładowy kod, który obejmuje konfigurację usług Azure OpenAI i Speech.
Przykładowy kod umożliwia zamianę mowy na tekst i tekst na mowę w aplikacji.
Napiwek
Aby zapoznać się z innym przykładem, zobacz przykładowy kod rozmowy mowy na mowę.
Czyszczenie zasobów
Aby uniknąć ponoszenia niepotrzebnych kosztów platformy Azure, usuń zasoby utworzone w tym przewodniku Szybki start, jeśli nie są już potrzebne. Aby zarządzać zasobami, możesz użyć witryny Azure Portal.