Fordítások szintetizálása

Befejeződött

A TranslationRecognizer a beszélt bemenet lefordított átiratait adja vissza – lényegében a hallható beszéd szöveggé fordítását.

A fordítást beszédként is szintetizálhatja beszédfelolvasási megoldások létrehozásához. Ezt kétféleképpen teheti meg.

Eseményalapú szintézis

Ha 1:1 fordítást szeretne végezni (egyetlen forrásnyelvről egyetlen célnyelvre szeretne fordítást végezni), eseményalapú szintézissel hangstreamként rögzítheti a fordítást. Ehhez a következőket kell tennie:

Adja meg a lefordított beszéd kívánt hangját a TranslationConfigban. Hozzon létre egy eseménykezelőt a TranslationRecognizer objektum szintetizálási eseményéhez. Az eseménykezelőben a Result paraméter GetAudio() metódusával kérje le a lefordított hang bájtfolyamát. Az eseménykezelő implementálásához használt kód a használt programozási nyelvtől függően változik. A C# és a Python példákat a Speech SDK dokumentációjában találja.

Manuális szintézis

A manuális szintézis az eseményalapú szintézis alternatív megközelítése, amely nem igényli az eseménykezelő implementálását. A manuális szintézis segítségével hangfordításokat készíthet egy vagy több célnyelvhez.

A fordítások manuális szintézise lényegében csak két különálló művelet kombinációja, amelyekben:

  1. A TranslationRecognizer használatával szöveges átiratokká fordíthatja a beszélt bemeneteket egy vagy több célnyelven.
  2. A fordítási művelet eredményeként iterálja át a Fordítások szótárát egy SpeechSynthesizer használatával az egyes nyelvekhez tartozó hangstreamek szintetizálásához.