Syntetyzowanie tłumaczeń

Ukończone

Funkcja TranslationRecognizer zwraca przetłumaczone transkrypcje mówionych danych wejściowych — zasadniczo tłumaczenie słyszanej mowy na tekst.

Tłumaczenie można również syntetyzować jako mowę, aby tworzyć rozwiązania tłumaczenia mowy na mowę. Istnieją dwa sposoby, aby to osiągnąć.

Synteza oparta na zdarzeniach

Jeśli chcesz wykonać tłumaczenie 1:1 (tłumaczenie z jednego języka źródłowego na jeden język docelowy), możesz użyć syntezy opartej na zdarzeniach, aby przechwycić tłumaczenie jako strumień audio. W tym celu należy:

Określ żądany głos dla przetłumaczonej mowy w pliku TranslationConfig. Utwórz procedurę obsługi zdarzeń dla zdarzenia Synthesizing obiektu TranslationRecognizer. W procedurze obsługi zdarzeń użyj metody GetAudio() parametru Result , aby pobrać strumień bajtów przetłumaczonego dźwięku. Określony kod używany do implementowania programu obsługi zdarzeń różni się w zależności od używanego języka programowania. Zapoznaj się z przykładami języka C# i Python w dokumentacji zestawu Speech SDK.

Synteza ręczna

Synteza ręczna to alternatywne podejście do syntezy opartej na zdarzeniach, które nie wymaga zaimplementowania programu obsługi zdarzeń. Można użyć syntezy ręcznej do generowania tłumaczeń dźwiękowych dla co najmniej jednego języka docelowego.

Ręczna synteza tłumaczeń jest zasadniczo tylko kombinacją dwóch oddzielnych operacji, w których:

  1. Użyj elementu TranslationRecognizer , aby przetłumaczyć mówione dane wejściowe na transkrypcje tekstu w co najmniej jednym języku docelowym.
  2. Iterowanie w słowniku Tłumaczenia w wyniku operacji tłumaczenia przy użyciu narzędzia SpeechSynthesizer do syntetyzowania strumienia audio dla każdego języka.