Vertalingen synthetiseren

Voltooid

De TranslationRecognizer retourneert vertaalde transcripties van gesproken invoer- in wezen het vertalen van hoorbare spraak naar tekst.

U kunt de vertaling ook omzetten als spraak om oplossingen voor spraak-naar-spraakomzetting te maken. U kunt dit op twee manieren doen.

Op gebeurtenissen gebaseerde synthese

Als u 1:1-vertaling wilt uitvoeren (vertalen van één brontaal in één doeltaal), kunt u op gebeurtenissen gebaseerde synthese gebruiken om de vertaling vast te leggen als een audiostream. Hiervoor doet u het volgende:

Geef de gewenste stem op voor de vertaalde spraak in TranslationConfig. Maak een gebeurtenis-handler voor de Synthesizing-gebeurtenis van het Object TranslationRecognizer. Gebruik in de gebeurtenis-handler de methode GetAudio() van de parameter Result om de bytestroom van vertaalde audio op te halen. De specifieke code die wordt gebruikt voor het implementeren van een gebeurtenis-handler, is afhankelijk van de programmeertaal die u gebruikt. Zie de C# - en Python-voorbeelden in de Speech SDK-documentatie.

Handmatige synthese

Handmatige synthese is een alternatieve benadering van op gebeurtenissen gebaseerde synthese waarvoor u geen gebeurtenis-handler hoeft te implementeren. U kunt handmatige synthese gebruiken om audio-vertalingen te genereren voor een of meer doeltalen.

Handmatige synthese van vertalingen is in feite alleen de combinatie van twee afzonderlijke bewerkingen waarin u:

  1. Gebruik een TranslationRecognizer om gesproken invoer in teksttranscripties in een of meer doeltalen te vertalen.
  2. Doorloop de woordenlijst Vertalingen in het resultaat van de vertaalbewerking met behulp van een SpeechSynthesizer om een audiostroom voor elke taal te synthetiseren.