Wprowadzenie

Ukończone

Możliwości mowy sztucznej inteligencji umożliwiają zarządzanie systemami domowymi i automatycznymi za pomocą instrukcji głosowych, uzyskiwanie odpowiedzi z komputerów na pytania mówione, generowanie podpis z dźwięku i wiele innych.

Aby umożliwić taką interakcję, system sztucznej inteligencji musi obsługiwać dwie możliwości:

  • Rozpoznawanie mowy — możliwość wykrywania i interpretowania wypowiedzianych danych wejściowych
  • Synteza mowy — możliwość generowania mówionych danych wyjściowych

Usługa Azure AI Speech zapewnia funkcje zamiany mowy na tekst i tekst na mowę za pomocą rozpoznawania i syntezy mowy. Możesz użyć wstępnie utworzonych i niestandardowych modeli usługi Rozpoznawanie mowy dla różnych zadań, od transkrypcji dźwięku po tekst z wysoką dokładnością, do identyfikowania osób mówiących w konwersacjach, tworzenia niestandardowych głosów i nie tylko. Następnie dowiesz się, jak działają funkcje mowy sztucznej inteligencji.