تكوين تنسيق الصوت والأصوات
عند توليف الكلام، يمكنك استخدام كائن SpeechConfig لتخصيص الصوت الذي تعيده خدمة Azure Speech.
تنسيق الصوت
تدعم خدمة Azure Speech عدة صيغ إخراج لتدفق الصوت الذي يتم تولده بواسطة توليف الكلام. استنادا إلى احتياجاتك المحددة، يمكنك اختيار تنسيق استنادا إلى المطلوب:
- نوع ملف الصوت
- Sample-rate
- Bit-depth
على سبيل المثال ، تقوم كود Python التالي بتعيين تنسيق إخراج الكلام لكائن SpeechConfig محدد مسبقا يسمى speech_config:
speech_config.set_speech_synthesis_output_format(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm)
للحصول على قائمة كاملة بالصيغ المدعومة وقيم التعداد الخاصة بها، راجع توثيق Azure Speech SDK.
Voices
توفر خدمة Azure Speech عدة أصوات يمكنك استخدامها لتخصيص تطبيقاتك التي تعتمد على الكلام. يتم تحديد الأصوات بواسطة الأسماء التي تشير إلى إعدادات محلية واسم شخص - على سبيل المثال en-GB-George.
تعين التعليمات البرمجية التالية لمثال Python الصوت الذي سيتم استخدامه
speech_config.speech_synthesis_voice_name = "en-GB-George"
للحصول على معلومات حول الأصوات، راجع توثيق Azure Speech SDK.