Síntesis de traducciones

Completado

El objeto TranslationRecognizer devuelve las transcripciones traducidas de la entrada hablada, que básicamente traduce la voz en texto audible.

También puede sintetizar la traducción como voz para crear soluciones de traducción de voz a voz. Hay dos maneras en que puede lograrlo.

Síntesis basada en eventos

Si desea realizar la traducción 1:1 (traducir desde un idioma de origen a un idioma de destino único), puede usar una síntesis basada en eventos para capturar la traducción como secuencia de audio. Para ello, necesita lo siguiente:

Especificar en el objeto TranslationConfig la voz deseada para la voz traducida. Crear un controlador de eventos para el evento Synthesizing del objeto TranslationRecognizer. En el controlador de eventos, utilice el método GetAudio() del parámetro Result para recuperar la secuencia de bytes del audio traducido. El código específico que se usa para implementar un controlador de eventos varía en función del lenguaje de programación que se use. Consulte los ejemplos de C# y Python en la documentación del SDK de Voz.

Síntesis manual

La síntesis manual es un enfoque alternativo a la síntesis basada en eventos que no requiere implementar un controlador de eventos. Puede usar la síntesis manual para generar traducciones de audio para uno o varios idiomas de destino.

La síntesis manual de las traducciones es básicamente la combinación de dos operaciones independientes en las que:

  1. Usa un objeto TranslationRecognizer para traducir la entrada hablada a transcripciones de texto en uno o varios idiomas de destino.
  2. Recorre en iteración el diccionario Translations en el resultado de la operación de traducción, con un objeto SpeechSynthesizer para sintetizar una secuencia de audio para cada idioma.