تشغيل الصوت في المكالمة

يسمح لك إجراء التشغيل المقدم من خلال Azure Communication Services Call Automation SDK بتشغيل مطالبات الصوت للمشاركين في المكالمة. يمكن الوصول إلى هذا الإجراء من خلال التنفيذ من جانب الخادم للتطبيق الخاص بك. يمكنك تشغيل الصوت للاتصال بالمشاركين من خلال إحدى طريقتين؛

  • توفير وصول Azure Communication Services إلى الملفات الصوتية المسجلة مسبقا بتنسيق WAV، والتي يمكن ل Azure Communication Services الوصول إليها مع دعم المصادقة
  • النص العادي الذي يمكن تحويله إلى إخراج الكلام من خلال التكامل مع خدمات Azure الذكاء الاصطناعي.

يمكنك استخدام التكامل المعلن عنه حديثا بين Azure Communication Services وخدمات Azure الذكاء الاصطناعي لتشغيل استجابات مخصصة باستخدام Azure Text-To-Speech. يمكنك استخدام الإنسان مثل الأصوات العصبية التي تم إنشاؤها مسبقا خارج الصندوق أو إنشاء أصوات عصبية مخصصة فريدة من نوعها لمنتجك أو علامتك التجارية. لمزيد من المعلومات حول الأصوات واللغات واللغات المدعومة، راجع دعم اللغة والصوت لخدمة الكلام.

إشعار

تدعم Azure Communication Services حاليا تنسيقين للملفات، ملفات MP3 مع ملفات ID3V2TAG وWAV منسقة كصوت قناة أحادية PCM 16 بت مسجل بتردد 16 كيلوهرتز. يمكنك إنشاء ملفات الصوت الخاصة بك باستخدام تركيب الكلام باستخدام أداة إنشاء محتوى الصوت.

أصوات النص العصبي إلى كلام التي تم إنشاؤها مسبقا

تستخدم Microsoft شبكات عصبية عميقة للتغلب على حدود تركيب الكلام التقليدي فيما يتعلق بالإجهاد والتجميع في اللغة المنطوقة. التنبؤ Prosody وتركيب الصوت يحدث في وقت واحد، مما يؤدي إلى إخراج أكثر سوائل وطبيعية السبر. يمكنك استخدام هذه الأصوات العصبية لجعل التفاعلات مع روبوتات الدردشة والمساعدين الصوتيين أكثر طبيعية وجذابة. هناك أكثر من 100 صوت تم إنشاؤها مسبقا للاختيار من بينها. تعرف على المزيد حول أصوات تحويل النص إلى كلام في Azure.

حالات الاستخدام الشائعة

يمكن استخدام إجراء التشغيل بطرق عديدة، يتم سرد بعض الأمثلة على كيفية رغبة المطورين في استخدام إجراء التشغيل في تطبيقاتهم هنا.

إعلانات

قد يرغب تطبيقك في تشغيل نوع من الإعلانات عندما ينضم أحد المشاركين إلى المكالمة أو يغادرها، لإعلام المستخدمين الآخرين.

عملاء الخدمة الذاتية

في السيناريوهات مع IVRs والمساعدين الظاهريين، يمكنك استخدام التطبيق أو الروبوتات لتشغيل مطالبات الصوت للمتصلين، يمكن أن تكون هذه المطالبة في شكل قائمة لتوجيه المتصل من خلال تفاعله.

الضغط باستمرار على الموسيقى

يمكن أيضا استخدام إجراء التشغيل لتشغيل الموسيقى باستمرار للمتصلين. يمكن إعداد هذا الإجراء في حلقة بحيث تستمر الموسيقى في التشغيل حتى يتوفر عامل لمساعدة المتصل.

تشغيل رسائل التوافق

وكجزء من متطلبات الامتثال في مختلف الصناعات، من المتوقع أن يقوم البائعون برسائل قانونية أو رسائل امتثال للمتصلين، على سبيل المثال، "يتم تسجيل هذه المكالمة لأغراض تتعلق بالجودة".

نموذج بنية لتشغيل الصوت في المكالمة باستخدام تحويل النص إلى كلام

رسم تخطيطي يوضح بنية عينة للعب مع الذكاء الاصطناعي.

نموذج تصميم لتشغيل الصوت في مكالمة

لقطة شاشة لتدفق إجراء التشغيل.

القيود المعروفة

  • تدعم المطالبات النصية لتحويل النص إلى كلام 400 حرف كحد أقصى، إذا كانت المطالبة أطول من هذا، نقترح استخدام SSML لإجراءات التشغيل المستندة إلى النص إلى كلام.
  • بالنسبة للسيناريوهات التي تتجاوز فيها حد الحصة النسبية لخدمة Speech، يمكنك طلب زيادة هذا الحد باتباع الخطوات الموضحة هنا.

الخطوات التالية