Configurarea formatului audio și a vocilor

3 minute

Când sintetizezi vorbirea, poți folosi un obiect SpeechConfig pentru a personaliza sunetul returnat de Azure Speech în Foundry Tools.

Format audio

Azure Speech suportă mai multe formate de ieșire pentru fluxul audio generat prin sinteza vocală. În funcție de necesitățile dvs. specifice, puteți alege un format pe baza cerinței:

Tip fișier audio
Sample-rate
Bit-depth

De exemplu, următorul cod Python setează formatul de ieșire a vorbirii pentru un obiect SpeechConfig definit anterior numit speech_config:

speech_config.set_speech_synthesis_output_format(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm)

Pentru o listă completă a formatelor suportate și valorile lor de enumerare, consultați documentația Azure Speech SDK.

Voices

Serviciul Azure Speech oferă mai multe voci pe care le poți folosi pentru a-ți personaliza aplicațiile cu voce vocală. Vocile sunt identificate prin nume care indică o locație, numele unei persoane și alte detalii – de exemplu en-US-Brian:DragonHDLatestNeural.

Următorul cod De exemplu Python setează vocea de utilizat

speech_config.speech_synthesis_voice_name='en-US-Brian:DragonHDLatestNeural'

Pentru informații despre voci, consultați documentația Azure Speech SDK.

Feedback

Această pagină a fost utilă?