Co to jest tłumaczenie mowy?

Artykuł
01/22/2024

W tym artykule przedstawiono korzyści i możliwości usługi tłumaczenia mowy, która umożliwia zamianę mowy w czasie rzeczywistym na mowę i mowę na tłumaczenie tekstu strumieni audio.

Korzystając z zestawu Speech SDK lub interfejsu wiersza polecenia usługi Mowa, możesz zapewnić aplikacjom, narzędziom i urządzeniom dostęp do źródłowych transkrypcji i danych wyjściowych tłumaczenia dla podanego dźwięku. Tymczasowe transkrypcje i wyniki tłumaczenia są zwracane w miarę wykrywania mowy, a ostateczne wyniki można przekonwertować na syntetyzowaną mowę.

Aby uzyskać listę języków obsługiwanych na potrzeby tłumaczenia mowy, zobacz Obsługa języka i głosu.

Podstawowe funkcje

Tłumaczenie mowy na tekst z wynikami rozpoznawania.
Tłumaczenie mowy na mowę.
Obsługa tłumaczenia na wiele języków docelowych.
Wyniki tymczasowego rozpoznawania i tłumaczenia.

Rozpocznij

W pierwszym kroku wypróbuj przewodnik Szybki start dotyczący tłumaczenia mowy. Usługa tłumaczenia mowy jest dostępna za pośrednictwem zestawu SPEECH SDK i interfejsu wiersza polecenia usługi Mowa.

W usłudze GitHub znajdziesz mowę zestawu Speech SDK do tekstu i tłumaczenia . Te przykłady obejmują typowe scenariusze, takie jak odczytywanie dźwięku z pliku lub strumienia, ciągłe i jednosstrzałowe rozpoznawanie i tłumaczenie oraz praca z modelami niestandardowymi.

Następne kroki

Wypróbuj tłumaczenie mowy — szybki start
Instalowanie zestawu SPEECH SDK
Instalowanie interfejsu wiersza polecenia usługi Mowa

Co to jest tłumaczenie mowy?

Podstawowe funkcje

Rozpocznij

Następne kroki

Dodatkowe zasoby