Configurarea formatului audio și a vocilor
Când sintetizezi vorbirea, poți folosi un obiect SpeechConfig pentru a personaliza sunetul returnat de Azure Speech în Foundry Tools.
Format audio
Azure Speech suportă mai multe formate de ieșire pentru fluxul audio generat prin sinteza vocală. În funcție de necesitățile dvs. specifice, puteți alege un format pe baza cerinței:
- Tip fișier audio
- Sample-rate
- Bit-depth
De exemplu, următorul cod Python setează formatul de ieșire a vorbirii pentru un obiect SpeechConfig definit anterior numit speech_config:
speech_config.set_speech_synthesis_output_format(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm)
Pentru o listă completă a formatelor suportate și valorile lor de enumerare, consultați documentația Azure Speech SDK.
Voices
Serviciul Azure Speech oferă mai multe voci pe care le poți folosi pentru a-ți personaliza aplicațiile cu voce vocală. Vocile sunt identificate prin nume care indică o locație, numele unei persoane și alte detalii – de exemplu en-US-Brian:DragonHDLatestNeural.
Următorul cod De exemplu Python setează vocea de utilizat
speech_config.speech_synthesis_voice_name='en-US-Brian:DragonHDLatestNeural'
Pentru informații despre voci, consultați documentația Azure Speech SDK.