Co to jest tłumaczenie mowy?
W tym artykule przedstawiono korzyści i możliwości usługi tłumaczenia mowy, która umożliwia zamianę mowy w czasie rzeczywistym na mowę i mowę na tłumaczenie tekstu strumieni audio.
Korzystając z zestawu Speech SDK lub interfejsu wiersza polecenia usługi Mowa, możesz zapewnić aplikacjom, narzędziom i urządzeniom dostęp do źródłowych transkrypcji i danych wyjściowych tłumaczenia dla podanego dźwięku. Tymczasowe transkrypcje i wyniki tłumaczenia są zwracane w miarę wykrywania mowy, a ostateczne wyniki można przekonwertować na syntetyzowaną mowę.
Aby uzyskać listę języków obsługiwanych na potrzeby tłumaczenia mowy, zobacz Obsługa języka i głosu.
Podstawowe funkcje
- Tłumaczenie mowy na tekst z wynikami rozpoznawania.
- Tłumaczenie mowy na mowę.
- Obsługa tłumaczenia na wiele języków docelowych.
- Wyniki tymczasowego rozpoznawania i tłumaczenia.
Rozpocznij
W pierwszym kroku wypróbuj przewodnik Szybki start dotyczący tłumaczenia mowy. Usługa tłumaczenia mowy jest dostępna za pośrednictwem zestawu SPEECH SDK i interfejsu wiersza polecenia usługi Mowa.
W usłudze GitHub znajdziesz mowę zestawu Speech SDK do tekstu i tłumaczenia . Te przykłady obejmują typowe scenariusze, takie jak odczytywanie dźwięku z pliku lub strumienia, ciągłe i jednosstrzałowe rozpoznawanie i tłumaczenie oraz praca z modelami niestandardowymi.
Następne kroki
- Wypróbuj tłumaczenie mowy — szybki start
- Instalowanie zestawu SPEECH SDK
- Instalowanie interfejsu wiersza polecenia usługi Mowa