أهمية ميزة Permutation

توضح هذه المقالة كيفية استخدام مكون Permutation Feature Importance في مصمم التعلم الآلي من Microsoft Azure لحساب مجموعة من درجات أهمية الميزات لمجموعة بياناتك. يمكنك بعد ذلك الاستفادة من هذه الدرجات لمساعدتك في تحديد أفضل الميزات لاستخدامها في النموذج.

في هذا المكون، يتم تبديل قيم الميزات عشوائيًا، عمود واحد في كل مرة. يتم قياس أداء النموذج قبله وبعده. يمكنك اختيار أحد المقاييس القياسية لقياس الأداء.

تمثل الدرجات التي يرجعها المكون التغيير في أداء نموذج مدرب، بعد التبديل. تكون عادةً الميزات المهمة أكثر حساسية لعملية التبديل العشوائي، لذلك ستؤدي إلى درجات أهمية أعلى.

توفر هذه المقالة نظرة عامة على ميزة التبديل وأساسها النظري وتطبيقاتها في التعلم الآلي: Permutation Feature Importance.

كيفية استخدام Permutation Feature Importance

يتطلب إنشاء مجموعة من درجات الميزات أن يكون لديك نموذج مدرب بالفعل، بالإضافة إلى مجموعة بيانات اختبار.

  1. أضف مكون Permutation Feature Importance إلى مسار المعالجة الخاص بك. يمكنك العثور على هذا المكون في فئة تحديد الميزة.

  2. تعيين نموذج مدرب بالإدخال الأيسر. يجب أن يكون النموذج نموذج تراجع أو نموذج تصنيف.

  3. في الإدخال الصحيح، عيّن مجموعة بيانات. يفضل اختيار مجموعة مختلفة عن مجموعة البيانات التي استخدمتها لتدريب النموذج. تستخدم مجموعة البيانات هذه للتسجيل استناداً إلى النموذج المدرب. كما يتم استخدامه لتقييم النموذج بعد تغيير قيم الميزات.

  4. بالنسبة إلى القيم الأولية العشوائية، أدخل قيمة لاستخدامها كقيمة أولية للعشوائية. إذا حددت 0 (الافتراضي)، يتم إنشاء رقم استنادًا إلى ساعة النظام.

    القيمة الأولية اختيارية، ولكن يجب توفير قيمة إذا كنت تريد إمكانية إعادة الإنتاج عبر عمليات تشغيل نفس مسار المعالجة.

  5. بالنسبة إلى المقياس لقياس الأداء، حدد مقياسًا واحدًا لاستخدامه عند حوسبة جودة النموذج بعد التبديل.

    يدعم مصمم التعلم الآلي من Microsoft Azure المقاييس التالية، اعتمادًا على ما إذا كنت تقوم بتقييم أو تراجع نموذج تصنيف:

    • التصنيف

      الدقة، الإحكام، الاسترجاع

    • الانحدار

      الدقة، الاسترجاع، متوسط الخطأ المطلق، خطأ تربيعي للجذر، خطأ مطلق نسبي، خطأ تربيع نسبي، معامل التحديد

    للحصول على وصف أكثر تفصيلًا لمقاييس التقييم هذه وكيفية حسابها، راجع تقييم النموذج.

  6. إرسال المسار.

  7. يخرج المكون قائمة بأعمدة الميزات والنتائج المقترنة بها. يتم ترتيب القائمة بترتيب تنازلي للدرجات.

ملاحظات فنية

تعمل أهمية ميزة التبديل عن طريق تغيير قيم كل عمود ميزة بشكلٍ عشوائي، عمود واحد في كل مرة. ثم يقيّم النموذج.

تختلف غالبًا التصنيفات التي يوفرها المكون عن تلك التي تحصل عليها من تحديد الميزة المستندة إلى عامل التصفية. يحسب تحديد الميزة المستندة إلى عامل التصفية الدرجات قبل إنشاء نموذج.

سبب الفرق هو أن أهمية ميزة التبديل لا تقيس الاقتران بين الميزة والقيمة الهدف. بدلًا من ذلك، فإنه يلتقط مقدار تأثير كل ميزة على التوقعات من النموذج.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.