تكوين تنسيق الصوت والأصوات

3 دقائق

عند توليف الكلام، يمكنك استخدام كائن SpeechConfig لتخصيص الصوت الذي تعيده خدمة Azure Speech.

تنسيق الصوت

تدعم خدمة Azure Speech عدة صيغ إخراج لتدفق الصوت الذي يتم تولده بواسطة توليف الكلام. استنادا إلى احتياجاتك المحددة، يمكنك اختيار تنسيق استنادا إلى المطلوب:

نوع ملف الصوت
Sample-rate
Bit-depth

على سبيل المثال ، تقوم كود Python التالي بتعيين تنسيق إخراج الكلام لكائن SpeechConfig محدد مسبقا يسمى speech_config:

speech_config.set_speech_synthesis_output_format(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm)

للحصول على قائمة كاملة بالصيغ المدعومة وقيم التعداد الخاصة بها، راجع توثيق Azure Speech SDK.

Voices

توفر خدمة Azure Speech عدة أصوات يمكنك استخدامها لتخصيص تطبيقاتك التي تعتمد على الكلام. يتم تحديد الأصوات بواسطة الأسماء التي تشير إلى إعدادات محلية واسم شخص - على سبيل المثال en-GB-George.

تعين التعليمات البرمجية التالية لمثال Python الصوت الذي سيتم استخدامه

speech_config.speech_synthesis_voice_name = "en-GB-George"

للحصول على معلومات حول الأصوات، راجع توثيق Azure Speech SDK.

الملاحظات

هل كانت هذه الصفحة مفيدة؟