合成翻譯
TranslationRecognizer 會傳回口語輸入的翻譯轉譯 - 基本上會將聽覺語音翻譯成文字。
您也可以將翻譯合成為語音,以建立語音轉換語音翻譯解決方案。 有兩種方式可以達成此目的。
以事件為基礎的合成
當您想要執行 1:1 翻譯時(從一個來源語言翻譯為單一目標語言),您可以使用以事件為基礎的合成,將翻譯擷取為音訊串流。 若要這樣做,您需要:
在 TranslationConfig 中指定翻譯語音所需的語音。 為 TranslationRecognizer 物件的 合成 事件建立事件處理程式。 在事件處理程式中,使用 Result 參數的 GetAudio() 方法來擷取已翻譯音訊的位元組數據流。 用來實作事件處理程式的特定程式代碼會根據您使用的程式設計語言而有所不同。 請參閱語音 SDK 檔中的 C# 和 Python 範例。
手動合成
手動合成是事件型合成的替代方法,不需要您實作事件處理程式。 您可以使用手動合成來產生一或多個目標語言的音訊翻譯。
手動合成翻譯基本上只是兩個不同作業的組合,您可以在其中:
- 使用 TranslationRecognizer 將口語輸入翻譯成一或多個目標語言的文字轉譯。
- 使用SpeechSynthesizer來逐一查看翻譯作業結果中的Translations字典,以合成每個語言的音頻數據流。