تحليل الحقائق المضادة وماذا-لو

تعالج الإجراءات المضادة ماذا لو مسألة ما يمكن أن يتنبأ به النموذج إذا قمت بتغيير إدخال الإجراء. فهي تمكن فهم نموذج التعلم الآلي وتصحيح الأخطاء من حيث كيفية تفاعله مع تغييرات الإدخال (الميزة).

تقريب تقنيات قابلية التفسير القياسية لنموذج التعلم الآلي أو ميزات التصنيف حسب أهميتها التنبؤية. وعلى النقيض من ذلك، فإن التحليل المضاد "يستجوب" نموذجا لتحديد التغييرات التي تطرأ على نقطة بيانات معينة التي من شأنها عكس قرار النموذج.

يساعد هذا التحليل في فصل تأثير الميزات المرتبطة بمعزل عن غيرها. كما يساعدك على الحصول على فهم أكثر دقة لمقدار تغيير الميزة المطلوب لرؤية انعكاس قرار النموذج لنماذج التصنيف وتغيير القرار لنماذج الانحدار.

يحتوي التحليل المضاد ومكون what-ifللوحة معلومات الذكاء الاصطناعي المسؤولة على وظيفتين:

  • إنشاء مجموعة من الأمثلة مع الحد الأدنى من التغييرات على نقطة معينة بحيث تغير تنبؤ النموذج (تظهر أقرب نقاط البيانات مع تنبؤات النموذج المعاكس).
  • تمكين المستخدمين من إنشاء اضطرابات ماذا لو الخاصة بهم لفهم كيفية تفاعل النموذج مع تغييرات الميزات.

أحد أهم المفاضلات لمكون التحليل المضاد للوحة معلومات الذكاء الاصطناعي المسؤول هو حقيقة أنه يمكنك تحديد الميزات التي يجب أن تختلف ونطاقاتها المسموح بها للحصول على أمثلة صحيحة ومنطقية مضادة للواقع.

تأتي قدرات هذا المكون من حزمة DiCE .

استخدم الحقائق المضادة ل what-if عندما تحتاج إلى:

  • افحص معايير الإنصاف والموثوقية كمقيم للقرار من خلال تشويش السمات الحساسة مثل الجنس والعرق، ثم مراقبة ما إذا كانت تنبؤات النموذج تتغير أم لا.
  • تصحيح حالات الإدخال المحددة في العمق.
  • توفير حلول للمستخدمين وتحديد ما يمكنهم القيام به للحصول على نتيجة مرغوب فيها من النموذج.

كيف يتم إنشاء الأمثلة المغايرة؟

لتوليد الحقائق المضادة، تنفذ DiCE عدداً قليلاً من الأساليب اللاأدرية النموذجية. تنطبق هذه الطرق على أي مصنف أو عامل ارتداد صندوقي معتم. إنها تستند إلى أخذ عينات من النقاط القريبة إلى نقطة إدخال، مع تحسين وظيفة الخسارة بناءً على القرب (واختيارياً، التباين، والتنوع، والجدوى). الطرق المدعومة حالياً هي:

  • البحث العشوائي: يقوم هذا الأسلوب بنماذج النقاط عشوائيا بالقرب من نقطة استعلام وإرجاع الحقائق المضادة كنقاط تكون تسميتها المتوقعة هي الفئة المطلوبة.
  • البحث الجيني: تقوم هذه الطريقة بأخذ عينات من النقاط باستخدام خوارزمية وراثية، نظرا للهدف المشترك المتمثل في تحسين التقارب من نقطة الاستعلام، وتغيير أقل عدد ممكن من الميزات، والبحث عن التنوع بين العوامل المضادة التي تم إنشاؤها.
  • بحث شجرة KD: ترجع هذه الخوارزمية كائنات مضادة من مجموعة بيانات التدريب. يقوم بإنشاء شجرة KD فوق نقاط بيانات التدريب استنادا إلى دالة المسافة ثم إرجاع أقرب نقاط إلى نقطة استعلام معينة تنتج التسمية المتوقعة المطلوبة.

الخطوات التالية