إنشاء مجموعة اختبار استجابة واحدة

يختبر تقييم استجابة فردي وكيلك على كل سؤال غير مرتبط في كل مرة، بدلاً من الدردشة الكاملة. على سبيل المثال، يطرح تقييم استجابة واحد لوكيل خدمة العملاء ما هي ساعات عملك؟، ويسجل استجابة الوكيل لهذا السؤال، ثم يبدأ بسؤال جديد، كيف يمكنني العثور على محفوظات الطلبات الخاصة بي؟

تعد تقييمات الاستجابة المفردة مفيدة عندما تريد اختبار وكيلك حول كيفية إجاباته على أسئلة محددة، وعلى القدرات التي يستدعيها، وعلى الصياغة الدقيقة التي يستخدمها في إجاباته. يمكنك أيضا تشغيل تقييم المحادثة، والذي يسمح لك بتقييم سلوك وكيلك على مدى تفاعل أطول.

تستخدم التقييمات مجموعات الاختبار. تتكون مجموعة الاختبار لتقييمات الاستجابة الفردية من مجموعة تصل إلى 100 حالة اختبار. عند تشغيل تقييم وكيل، يمكنك تحديد مجموعة اختبار ويقوم Copilot Studio بتشغيل كل حالة اختبار في تلك المجموعة ضد الوكيل الخاص بك.

يمكنك إنشاء حالات اختبار داخل مجموعة اختبار يدويا، أو استيرادها باستخدام جدول بيانات، أو استخدام الذكاء الاصطناعي لإنشاء رسائل استنادا إلى تصميم الوكيل وموارده. يمكنك بعد ذلك اختيار الطريقة التي تريد بها قياس جودة استجابات وكيلك لكل حالة اختبار ضمن مجموعة اختبار.

لمزيد من المعلومات حول كيفية عمل تقييم العامل، راجع حول تقييم العامل.

لمعرفة كيفية تحرير مجموعة اختبار موجودة، راجع تغيير تفاصيل مجموعة الاختبار.

مهم

تتوفر نتائج الاختبار في Copilot Studio لمدة 89 يوما. لحفظ نتائج الاختبار لفترة أطول، قم بتصدير النتائج إلى ملف CSV.

إنشاء مجموعة اختبار جديدة

  1. انتقل إلى صفحة التقييم الخاصة بوكيلك.

    لقطة شاشة توضح كيفية تحديد علامة التبويب التقييم عند ضغط اختيار علامة التبويب بسبب حجم الشاشة.

  2. حدد New evaluation، ثم حدد Single response.

    لقطة شاشة تعرض زر إنشاء اختبار جديد في صفحة التقييم.

  3. اختر الأسلوب الذي تريد استخدامه لإنشاء مجموعة الاختبار الخاصة بك. يمكن أن تحتوي مجموعة الاختبار على ما يصل إلى 100 حالة اختبار.

    • مجموعة الأسئلة السريعة لتمكين Copilot Studio من إنشاء حالات اختبار تلقائيًا بناءً على وصف وكيلك، وتعليماته، وقدراته. ينشئ هذا الخيار 10 أسئلة لتشغيل تقييمات صغيرة وسريعة أو لبدء إنشاء مجموعة اختبار أكبر.
    • مجموعة كاملة من الأسئلة لتمكين Copilot Studio من إنشاء حالات اختبار باستخدام أحد مصادر المعرفة أو المواضيع واختر عدد الأسئلة التي تريد إنشاؤها.
    • استخدم محادثة الدردشة الاختبارية لملء مجموعة الاختبار تلقائيا بالأسئلة التي قدمتها في دردشة الاختبار. يستخدم هذا الأسلوب أسئلة من أحدث دردشة اختبار. يمكنك أيضا بدء تقييم من دردشة الاختبار باستخدام أيقونة التقييم .
      لقطة شاشة تعرض زر إنشاء اختبار جديد في دردشة الاختبار.
    • استيراد حالات الاختبار من ملف عن طريق سحب الملف إلى المنطقة المعينة، أو تحديد استعراض لتحميل ملف، أو تحديد أحد خيارات التحميل الأخرى.
    • أو اكتب بعض الأسئلة بنفسك لإنشاء مجموعة اختبار يدويا. اتبع الخطوات لتحرير مجموعة اختبار لإضافة حالات الاختبار وتحريرها.
    • استخدم بيانات الإنتاج استنادًا إلى المواضيع من التحليل الخاص بوكيلك. لقطة شاشة تعرض خيار تقييم لنسق في قائمة النسق لنسق واحد.
  4. ضمن الاسم، أدخل اسما لمجموعة الاختبار الخاصة بك.

  5. تغيير أساليب الاختبار التي تريد استخدامها أو إضافتها:

    • إضافة أسلوب جديد:
      1. حدد Add test method.
      2. حدد جميع الطرق التي تريد الاختبار بها، ثم حدد موافق.
      3. تتطلب بعض الطرائق درجة اجتياز. تحدد درجة النجاح المعايير التي تؤدي إلى نجاح أو فشل. قم بتعيين النتيجة، ثم حدد موافق.
      4. تتطلب بعض الأساليب إضافة استجابات أو كلمات أساسية متوقعة لكل حالة من حالات الاختبار الخاصة بك. لمزيد من المعلومات، راجع اختيار أساليب التقييم
    • حدد أسلوب اختبار موجود لتحريره أو حذفه.
    أسلوب الاختبار المقاييس نوع مجموعة الاختبار التقييم تكوينات
    جودة عامة ما مدى جودة استجابات حالة الاختبار بناءً على الصفات المحددة استجابة واحدة أو محادثة واحدة تم التقيم على أساس 100% ‏‫بلا
    مقارنة المعنى مدى تطابق معنى إجابة حالة الاختبار مع الإجابة المتوقعة استجابة واحدة تم التقيم على أساس 100% درجة النجاح، الإجابة المتوقعة
    استخدام القدرة ما إذا كانت حالة الاختبار تستخدم جميع الموارد المتوقعة أو أي موارد متوقعة استجابة واحدة تمرير/فشل القدرات المتوقعة
    مطابقة الكلمة الأساسية ما إذا كانت حالة الاختبار تستخدم كل الكلمات الأساسية أو العبارات المتوقعة أو أي منها استجابة واحدة أو محادثة واحدة تمرير/فشل الكلمات الأساسية أو العبارات المتوقعة
    تشابه النص مدى تطابق نص إجابة حالة الاختبار مع الإجابة المتوقعة استجابة واحدة تم التقيم على أساس 100% درجة النجاح، الإجابة المتوقعة
    مطابقة تامة ما إذا كانت إجابة حالة الاختبار تطابق الإجابة المتوقعة بالضبط استجابة واحدة تمرير/فشل الإجابة المتوقعة
    Custom ما إذا كانت استجابة حالة الاختبار تفي بمعاييرك أو توقعاتك المحددة. استجابة واحدة أو محادثة واحدة اجتياز/رسوب (استيفاء معايير التسمية المحددة) الاسم، إرشادات التقييم، التسميات
  6. تحرير تفاصيل حالات الاختبار. تتطلب جميع أساليب الاختبار، باستثناء الجودة العامة، استجابات أو كلمات أساسية متوقعة. لمزيد من المعلومات حول تحرير حالات الاختبار، راجع تعديل مجموعة اختبار.

  7. حدد ملف تعريف المستخدم، ثم حدد الحساب الذي تريد استخدامه لمجموعة الاختبار هذه أو أضفه، أو تابع دون مصادقة. يستخدم التقييم هذا الحساب للاتصال بمصادر المعرفة والأدوات أثناء الاختبار. إذا تم تحديد حساب مختلف للتقييم عن الحساب الذي يحتوي على مصادقة الموصل، فسيفشل الوكلاء الذين يستخدمون الموصلات أو الأدوات. للحصول على معلومات حول إضافة ملفات تعريف المستخدمين وإدارتها، راجع إدارة ملفات تعريف المستخدمين والاتصالات.

    ملحوظة

    يستخدم الاختبار التلقائي مصادقة حساب الاختبار المحدد. إذا كان لدى وكيلك مصادر معارف أو اتصالات تتطلب مصادقة محددة، فحدد الحساب المناسب لاختبارك. عندما ينشئ Copilot Studio حالات اختبار، فإنه يستخدم بيانات اعتماد المصادقة لحساب متصل للوصول إلى مصادر معارف الوكيل وأدواته. يمكن أن تتضمن حالات الاختبار التي تم إنشاؤها بيانات حساسة يمكن للحساب المتصل الوصول إليها. يمكن لأي صانع له حق الوصول إلى العامل أيضا عرض مجموعات الاختبار المرتبطة بهذا العامل.

  8. حدد Save لتحديث مجموعة الاختبار دون تشغيل حالات الاختبار أو Evaluate لتشغيل مجموعة الاختبار على الفور.

قيود إنشاء حالات الاختبار

فشل إنشاء حالة الاختبار إذا انتهك سؤال واحد أو أكثر إعدادات الإشراف على المحتوى الخاصة بوكيلك. وتشمل الأسباب المحتملة ما يلي:

  • تقود إرشادات العامل أو موضوعاته النموذج إلى إنشاء محتوى يقوم النظام بوضع علامة عليه.
  • يتضمن مصدر المعرفة المتصل محتوى حساسا أو مقيدا.
  • إعدادات الإشراف على المحتوى الخاصة بالعامل صارمة للغاية.

لحل المشكلة، جرب إجراءات مختلفة، مثل ضبط مصادر المعرفة أو تحديث الإرشادات أو تعديل إعدادات الإشراف.

يمكن أن تحتوي مجموعة الاختبار على ما يصل إلى 100 حالة اختبار.

إنشاء مجموعة اختبار من المعرفة أو الموضوعات

يمكنك اختبار وكيلك عن طريق إنشاء أسئلة باستخدام المعلومات ومصادر المحادثة التي يمتلكها وكيلك بالفعل. أسلوب الاختبار هذا جيد لاختبار كيفية استخدام وكيلك لمصدر معارف أو مواضيع لديه بالفعل، ولكنه ليس جيدا لاختبار فجوات المعلومات.

يمكنك إنشاء حالات اختبار باستخدام مصادر المعرفة التالية:

  • النص

  • مايكروسوفت وورد

  • مايكروسوفت إكسل

  • ملفات PDF

  • محتوى Sharepoint

يمكنك استخدام ملفات تصل إلى 5 ميغابايت لإنشاء أسئلة اختبار.

لإنشاء مجموعة اختبار:

  1. في تقييم جديد، حدد مجموعة الأسئلة الكاملة.

  2. حدد إما Knowledge أو Topics.

    • تعمل المعرفة بشكل أفضل مع العوامل التي تستخدم التنسيق التوليدي. ينشئ هذا الأسلوب أسئلة باستخدام أحد مصادر المعرفة الخاصة بوكيلك.
    • تعمل الموضوعات بشكل أفضل مع العوامل التي تستخدم التنسيق الكلاسيكي. ينشئ هذا الأسلوب أسئلة باستخدام مواضيع وكيلك.
  3. بالنسبة إلى Knowledge، حدد مصدر المعرفة الذي تريد استخدامه لإنشاء أسئلة.

    لقطة شاشة تعرض اختيار مصادر المعرفة لتضمينها في إنشاء حالة الاختبار.

  4. بالنسبة إلى المعرفةوالموضوعات، حدد شريط التمرير واسحبه لاختيار عدد الأسئلة التي تريد إنشاؤها.

    لقطة شاشة تعرض شريط التمرير لتحديد عدد الأسئلة التي يجب إنشاؤها.

  5. حدد إنشاء.

  6. ضمن الاسم، أدخل اسما لمجموعة الاختبار الخاصة بك.

  7. تغيير أساليب الاختبار التي تريد استخدامها أو إضافتها:

    • إضافة أسلوب جديد:
      1. حدد Add test method.
      2. حدد جميع الطرق التي تريد الاختبار بها، ثم حدد موافق. يمكنك إضافة أساليب متعددة.
      3. بالنسبة لبعض الأساليب، قم بتعيين درجة النجاح، ثم حدد موافق. تحدد درجة النجاح المعايير التي تؤدي إلى نجاح أو فشل.
      4. تتطلب بعض الأساليب إضافة استجابات أو كلمات أساسية متوقعة لكل حالة من حالات الاختبار الخاصة بك. لمزيد من المعلومات، راجع اختيار أساليب التقييم
    • حدد أسلوب اختبار موجود لتحريره أو حذفه.
  8. تحرير تفاصيل حالات الاختبار. تتطلب جميع حالات الاختبار التي تستخدم الأساليب، باستثناء الجودة العامة، استجابات متوقعة. لمزيد من المعلومات حول التحرير، راجع تعديل مجموعة اختبار.

  9. حدد Save لتحديث مجموعة الاختبار دون تشغيل حالات الاختبار أو Evaluate لتشغيل مجموعة الاختبار على الفور.

إنشاء ملف مجموعة اختبار لاستيراده

بدلا من إنشاء حالات الاختبار مباشرة في Copilot Studio، يمكنك إنشاء ملف جدول بيانات مع جميع حالات الاختبار واستيرادها لإنشاء مجموعة الاختبار الخاصة بك. يمكنك إنشاء كل سؤال اختبار، وتحديد أسلوب الاختبار الذي تريد استخدامه، وتحديد الردود المتوقعة لكل سؤال. عند الانتهاء من إنشاء الملف، احفظه كملف .csv أو .txt واستورده إلى Copilot Studio.

مهم

  • يمكن أن يحتوي الملف على ما يصل إلى 100 سؤال.
  • يمكن أن يصل كل سؤال إلى عدد 1000 حرف، بما في ذلك المسافات.
  • يجب أن يكون الملف بتنسيق قيم مفصولة بفواصل (CSV) أو بصيغة نصية.

لإنشاء ملف الاستيراد:

  1. افتح تطبيق جدول بيانات (على سبيل المثال، Microsoft Excel). يمكنك تنزيل قالب CSV ضمن مصدر البيانات بعد تحديد تقييم جديد.

  2. أضف العناوين التالية، بهذا الترتيب، في الصف الأول:

    • سؤال
    • الاستجابة المتوقعة
    • أسلوب الاختبار
  3. أدخل أسئلة الاختبار في عمود السؤال . يمكن أن يتكون كل سؤال من 1000 حرف أو أقل، بما في ذلك المسافات.

  4. أدخل أحد أساليب الاختبار التالية لكل سؤال في عمود أسلوب الاختبار :

    • جودة عامة
    • مقارنة المعنى
    • التشابه
    • تطابق تام
    • مطابقة الكلمة الأساسية
  5. أدخل الإجابات المتوقعة لكل سؤال في عمود الاستجابة المتوقعة . الاستجابات المتوقعة اختيارية لاستيراد مجموعة اختبار. ومع ذلك، تحتاج إلى استجابات متوقعة لتشغيل المطابقة والتشابه ومقارنة حالات اختبار المعنى.

  6. احفظ الملف كملف .csv أو .txt.

  7. قم باستيراد الملف باتباع الخطوات الواردة في إنشاء مجموعة اختبار جديدة.

إنشاء مجموعة اختبار استنادا إلى موضوع

إنشاء مجموعة اختبار مع أسئلة من المحادثات مع مستخدمين حقيقيين. يستخدم هذا الأسلوب الثيمات (معاينة)، الموجودة في تحليلات وكيلك.

مواضيع هي مجموعات من الأسئلة المأخوذة من مجموعة أسئلة المستخدم والتي تُحفز على توليد الإجابات. عند إنشاء مجموعة اختبار باستخدام نسق، يمكنك إنشاء حالات الاختبار من الأسئلة التي يطرحها المستخدمون المتعلقة بهذا النسق.

استخدم مجموعات الاختبار هذه لإجراء تقييمات تركز على منطقة واحدة أو موضوع من نطاق وكيلك. على سبيل المثال، إذا كان لديك وكيل خدمة عملاء، يمكنك تتبع جودة الإجابة لأسئلة الفوترة والمدفوعات بشكل منفصل عن حالات الاستخدام الأخرى مثل استكشاف الأخطاء وإصلاحها.

ملحوظة

قبل إنشاء مجموعات الاختبار من النسق، تحتاج إلى الوصول إلى النسق ضمن التحليلات. راجع المتطلبات الأساسية للثيمات (معاينة).

  1. على صفحة تحليلات الْوكيل الْخاص بك، انتقل إلى قائمة الْنسق.

  2. حرك الماوس فوق موضوع، ثم حدد تقييم.

    لقطة شاشة تعرض خيار تقييم لنسق في قائمة النسق.

    يمكنك أيضا تحديد عرض الكل لمشاهدة المزيد من النسق، ثم تحديد تقييم.

  3. حدد إنشاء وفتح.

  4. تحرير تفاصيل مجموعات الاختبار والحالات. تتطلب جميع حالات الاختبار التي تستخدم الأساليب، باستثناء الجودة العامة، استجابات متوقعة. لمزيد من المعلومات حول التحرير، راجع تعديل مجموعة اختبار.

  5. حدد Save لتحديث مجموعة الاختبار دون تشغيل حالات الاختبار أو Evaluate لتشغيل مجموعة الاختبار على الفور.