Co to jest tłumaczenie mowy?

W tym artykule przedstawiono korzyści i możliwości usługi tłumaczenia mowy, która umożliwia zamianę mowy w czasie rzeczywistym na mowę i mowę na tłumaczenie tekstu strumieni audio.

Korzystając z zestawu Speech SDK lub interfejsu wiersza polecenia usługi Mowa, możesz zapewnić aplikacjom, narzędziom i urządzeniom dostęp do źródłowych transkrypcji i danych wyjściowych tłumaczenia dla podanego dźwięku. Tymczasowe transkrypcje i wyniki tłumaczenia są zwracane w miarę wykrywania mowy, a ostateczne wyniki można przekonwertować na syntetyzowaną mowę.

Aby uzyskać listę języków obsługiwanych na potrzeby tłumaczenia mowy, zobacz Obsługa języka i głosu.

Podstawowe funkcje

  • Tłumaczenie mowy na tekst z wynikami rozpoznawania.
  • Tłumaczenie mowy na mowę.
  • Obsługa tłumaczenia na wiele języków docelowych.
  • Wyniki tymczasowego rozpoznawania i tłumaczenia.

Rozpocznij

W pierwszym kroku wypróbuj przewodnik Szybki start dotyczący tłumaczenia mowy. Usługa tłumaczenia mowy jest dostępna za pośrednictwem zestawu SPEECH SDK i interfejsu wiersza polecenia usługi Mowa.

W usłudze GitHub znajdziesz mowę zestawu Speech SDK do tekstu i tłumaczenia . Te przykłady obejmują typowe scenariusze, takie jak odczytywanie dźwięku z pliku lub strumienia, ciągłe i jednosstrzałowe rozpoznawanie i tłumaczenie oraz praca z modelami niestandardowymi.

Następne kroki