تجميع إدخال المستخدم

مع إصدار إجراء Azure Communication Services Call Automation Recognize، يمكن للمطورين الآن تحسين تطبيقات IVR أو مركز الاتصال الخاصة بهم للتعرف على إدخال المستخدم. أحد أكثر سيناريوهات التعرف شيوعا هو تشغيل رسالة للمستخدم، والتي تطالبه بتقديم استجابة يتم التعرف عليها بعد ذلك من قبل التطبيق، بمجرد التعرف على التطبيق ثم تنفيذ إجراء مقابل. يمكن تلقي المدخلات من المتصلين بعدة طرق، والتي تشمل DTMF (إدخال المستخدم عبر الأرقام الموجودة على جهاز الاتصال الخاص بهم)، أو الكلام أو مزيج من كل من DTMF والكلام.

التعرف على الصوت باستخدام تحويل الكلام إلى نص

يتيح لك تكامل خدمات Azure Communications مع خدمات Azure الذكاء الاصطناعي، من خلال إجراء Recognize تحليل الصوت في الوقت الفعلي لكتابة الكلمة المنطوقة في نص. تستخدم Microsoft نموذج اللغة العالمي كنموذج أساسي يتم تدريبه باستخدام البيانات المملوكة ل Microsoft ويعكس اللغة المنطوقة شائعة الاستخدام. يتم تدريب هذا النموذج مسبقا مع اللهجات والهاتفية التي تمثل مختلف المجالات الشائعة. لمزيد من المعلومات حول اللغات المدعومة، راجع اللغات والدعم الصوتي لخدمة الكلام.

Dtmf

التعرف على النغمات المزدوجة (DTMF) هو عملية فهم النغمات/الأصوات التي يتم إنشاؤها بواسطة الهاتف عند الضغط على رقم. المعدات في الطرف المتلقي الاستماع لنغمة معينة ثم تحويلها إلى أوامر. تشير هذه الأوامر بشكل عام إلى هدف المستخدم عند التنقل في قائمة في سيناريو IVR أو في بعض الحالات يمكن استخدامها لالتقاط المعلومات المهمة التي يحتاج المستخدم إلى توفيرها عبر لوحة مفاتيح الهواتف الخاصة به.

أحداث DTMF والنغمات المرتبطة بها

الحدث نغمة
0 صفر
1 واحد
2 اثنان
3 ثلاثة
4 أربعة
5 خمسة
6 ستة
7 سبعه
8 ثمانية
9 تسعه
ش A
B مضمن
C C
D D
* نجمة
# الجنيه

حالات الاستخدام الشائعة

يمكن استخدام إجراء التعرف لأسباب عديدة، فيما يلي بعض الأمثلة حول كيفية استخدام المطورين لإجراء التعرف في تطبيقهم.

تحسين رحلة المستخدم باستخدام مطالبات الخدمة الذاتية

  • يمكن للمستخدمين التحكم في المكالمة - من خلال تمكين التعرف على الإدخال، تسمح للمتصل بالتنقل في قائمة IVR وتوفير المعلومات التي يمكن استخدامها لحل استعلامهم.
  • جمع معلومات المستخدم - من خلال تمكين التعرف على الإدخال، يمكن للتطبيق الخاص بك جمع الإدخال من المتصلين. يمكن أن تكون هذه معلومات مثل أرقام الحسابات ومعلومات بطاقة الائتمان وما إلى ذلك.
  • تنسخ استجابة المتصل - باستخدام التعرف على الصوت، يمكنك جمع إدخال المستخدم ونسخ الصوت إلى نص وتحليله لتنفيذ إجراء تجاري محدد.

مقاطعه المطالبات الصوتية

يمكن للمستخدم الخروج من قائمة IVR والتحدث إلى وكيل بشري - مع انقطاع DTMF يمكن للتطبيق الخاص بك السماح للمستخدمين بمقاطعة تدفق قائمة IVR والقدرة على الدردشة مع وكيل بشري.

نموذج بنية لجمع إدخال المستخدم في مكالمة باستخدام التعرف على الصوت

رسم تخطيطي يوضح نموذج البنية ل Recognize الذكاء الاصطناعي Action.

نموذج بنية لجمع إدخال المستخدم في مكالمة

التعرف على الإجراء

القيود المعروفة

  • DTMF داخل النطاق غير مدعوم، استخدم RFC 2833 DTMF بدلا من ذلك.
  • تدعم المطالبات النصية لتحويل النص إلى كلام 400 حرف كحد أقصى، إذا كانت المطالبة أطول من هذا، نقترح استخدام SSML لإجراءات التشغيل المستندة إلى النص إلى كلام.
  • بالنسبة للسيناريوهات التي تتجاوز فيها حد الحصة النسبية لخدمة Speech، يمكنك طلب زيادة هذا الحد باتباع الخطوات الموضحة هنا.

الخطوات التالية