Wprowadzenie

Ukończone

Usługa Azure AI Speech udostępnia interfejsy API, których można użyć do tworzenia aplikacji z obsługą mowy. Obejmuje on:

  • Zamiana mowy na tekst: interfejs API, który umożliwia rozpoznawanie mowy, w którym aplikacja może akceptować wypowiedziane dane wejściowe.
  • Zamiana tekstu na mowę: interfejs API, który umożliwia syntezę mowy, w której aplikacja może udostępniać mówione dane wyjściowe.
  • Tłumaczenie mowy: interfejs API, którego można użyć do tłumaczenia mówionych danych wejściowych na wiele języków.
  • Rozpoznawanie osoby mówiącej: interfejs API, który umożliwia aplikacji rozpoznawanie poszczególnych osób mówiących na podstawie ich głosu.
  • Rozpoznawanie intencji: interfejs API, który używa interpretacji języka konwersacyjnego do określania semantycznego znaczenia wypowiedzianych danych wejściowych.

Ten moduł koncentruje się na rozpoznawaniu mowy i syntezie mowy, które są podstawowymi możliwościami dowolnej aplikacji obsługującej mowę.

Ten moduł obejmuje następujące zagadnienia:

  • Aprowizowanie zasobu platformy Azure dla usługi Azure AI Speech
  • Używanie interfejsu API zamiany mowy na tekst w celu zaimplementowania rozpoznawania mowy
  • Implementowanie syntezy mowy przy użyciu interfejsu API zamiany tekstu na mowę
  • Konfigurowanie formatu audio i głosów
  • Używanie języka znaczników syntezy mowy (SSML)

Jednostki w module zawierają ważne informacje koncepcyjne dotyczące usługi Azure AI Speech i sposób korzystania z interfejsu API za pomocą jednego z obsługiwanych zestawów SDK (software development kit), po których będzie można wypróbować usługę Azure AI Speech dla siebie w praktycznym ćwiczeniu. Aby wykonać ćwiczenia praktyczne, potrzebna jest subskrypcja platformy Microsoft Azure. Jeśli jej jeszcze nie masz, możesz zarejestrować się w celu uzyskania bezpłatnej wersji próbnej na stronie https://azure.com/free.