استخدام النص لواجهة برمجة تطبيقات الكلام

مكتمل

وبالمثل مع واجهات برمجة التطبيقات من تحويل الكلام إلى نص ، تقدم خدمة Azure Speech واجهات برمجة تطبيقات REST أخرى لتركيب الكلام:

  • واجهة برمجة تطبيقات تحويل النص إلى كلام ، وهي الطريقة الأساسية لإجراء تركيب الكلام.
  • واجهة برمجة تطبيقات تجميع الدفعات ، التي تم تصميمها لدعم عمليات الدفعات التي تحول كميات كبيرة من النص إلى صوت - على سبيل المثال لإنشاء كتاب صوتي من النص المصدر.

يمكنك معرفة المزيد حول واجهات برمجة تطبيقات REST في وثائق واجهة برمجة تطبيقات REST لتحويل النص إلى كلام. في الواقع، تستخدم معظم التطبيقات التفاعلية المدعومة بالكلام خدمة Azure Speech من خلال SDK خاص بلغة (برمجة).

استخدام حزمة تطوير البرمجيات الخاصة ب Azure Speech

كما هو الحال مع التعرف على الكلام، يتم بناء معظم التطبيقات التفاعلية المدعومة بالكلام باستخدام Azure Speech SDK.

نمط تنفيذ تركيب الكلام مشابه لنمط التعرف على الكلام:

رسم تخطيطي يوضح كيفية إنشاء كائن SpeechSynthesizer من SpeechConfig و AudioConfig، ويتم استخدام أسلوب SpeakTextAsync الخاص به لاستدعاء Speech API.

  1. استخدم كائن SpeechConfig لتغليف المعلومات المطلوبة للاتصال بمورد Azure Speech الخاص بك. على وجه التحديد، موقعهومفتاحه.
  2. اختياريا، استخدم AudioConfig لتعريف جهاز الإخراج للكلام المراد تركيبه. بشكل افتراضي، هذه هي سماعة النظام الافتراضية، ولكن يمكنك أيضا تحديد ملف صوتي، أو عن طريق تعيين هذه القيمة بشكل صريح إلى قيمة خالية، يمكنك معالجة كائن دفق الصوت الذي يتم إرجاعه مباشرة.
  3. استخدم SpeechConfig و AudioConfig لإنشاء كائن SpeechSynthesizer . هذا الكائن هو عميل وكيل لواجهة برمجة تطبيقات Text to speech .
  4. استخدم أساليب كائن SpeechSynthesizer لاستدعاء وظائف واجهة برمجة التطبيقات الأساسية. على سبيل المثال، تستخدم طريقة SpeakTextAsync() خدمة Azure Speech لتحويل النص إلى صوت منطوق.
  5. معالجة الرد من خدمة Azure Speech. في حالة أسلوب SpeakTextAsync ، تكون النتيجة كائن SpeechSynthesisResult الذي يحتوي على الخصائص التالية:
    • بيانات صوتية
    • خصائص
    • سبب
    • معرف النتيجة

عند تركيب الكلام بنجاح، يتم تعيين الخاصية Reason إلى التعداد SynthesizingAudioCompleted وتحتوي الخاصية AudioData على دفق الصوت (الذي، اعتمادا على AudioConfig قد تم إرساله تلقائيا إلى مكبر صوت أو ملف).