مكون الانحدار اللوجستي Two-Class

مقالة
06/01/2023

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج انحدار لوجستي يمكن استخدامه للتنبؤ بنتيجة اثنين (واثنين فقط).

الانحدار اللوجستي هو تقنية إحصائية معروفة تستخدم لنمذجة أنواع عديدة من المشاكل. هذه الخوارزمية هي طريقة تعلم خاضعة للإشراف ؛ لذلك، يجب توفير مجموعة بيانات تحتوي بالفعل على النتائج لتدريب النموذج.

حول الانحدار اللوجستي

التراجع اللوجستي هو أسلوب معروف في الإحصاءات يستخدم للتنبؤ باحتمال حدوث نتيجة، وهو شائع بشكل خاص لمهام التصنيف. تتنبأ الخوارزمية باحتمال حدوث حدث عن طريق ملاءمة البيانات لوظيفة لوجستية.

في هذا المكون، يتم تحسين خوارزمية التصنيف للمتغيرات الثنائية أو الثنائية. إذا كنت بحاجة إلى تصنيف نتائج متعددة، فاستخدم مكون الانحدار اللوجستي متعدد الطبقات.

كيفية التهيئة

لتدريب هذا النموذج، يجب توفير مجموعة بيانات تحتوي على تسمية أو عمود فئة. نظرًا لأن هذا المكون مخصص لمشاكل من فئتين، يجب أن يحتوي عمود التسمية أو الفئة على قيمتين بالضبط.

على سبيل المثال، قد يكون عمود التسمية [تم التصويت] بقيم محتملة من "نعم" أو "لا". أو، قد يكون [مخاطر الائتمان]، مع القيم المحتملة "عالية" أو "منخفضة".

أضف مكون الانحدار اللوجستي من فئتين إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك.
قم بتحديد الطريقة التي تريد تدريب النموذج بها عن طريق تعيين خيارإنشاء وضع المدرب.
- معلمة واحدة: إذا كنت تعرف كيف تريد تكوين النموذج، يمكنك توفير مجموعة معينة من القيم كوسيطات.
- نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات، يمكنك العثور على المعلمات المثلى باستخدام مكون Tune Model Hyperparameters. يمكنك توفير بعض مجموعة من القيم، ويكرر المدرب على مجموعات متعددة من الإعدادات لتحديد مجموعة القيم التي تنتج أفضل نتيجة.
بالنسبة إلى التسامح مع التحسين، حدد قيمة عتبة لاستخدامها عند تحسين النموذج. إذا كان التحسين بين التكرارات أقل من الحد المحدد، تعتبر الخوارزمية متقاربة على حل، ويتوقف التدريب.
بالنسبة لوزن تنظيم L1ووزن تنظيم L2، اكتب قيمة لاستخدامها لمعلمات التسوية L1 وL2. يوصى بالقيمة غير الصفرية لكليهما.
التسوية هي طريقة لمنع الإفراط في المعامل من خلال معاقبة النماذج ذات القيم المعاملية المتطرفة. يعمل التسوية عن طريق إضافة العقوبة المقترنة بقيم المعاملات إلى خطأ الفرضية. وبالتالي، فإن نموذجًا دقيقًا بقيم معاملات قصوى سيعاقب أكثر، ولكن نموذج أقل دقة بقيم أكثر تحفظًا سيعاقب أقل.

تسوية L1 وL2 لها تأثيرات واستخدامات مختلفة.
- يمكن تطبيق L1 على نماذج متفرقة، وهو أمر مفيد عند العمل مع البيانات عالية الأبعاد.
- وعلى النقيض من ذلك، يفضل تنظيم L2 للبيانات غير المتفرقة.
تدعم هذه الخوارزمية مجموعة خطية من قيم تسوية L1 وL2: أي إذا x = L1 وy = L2، ثم ax + by = c تحدد الامتداد الخطي لشروط التسوية.

إشعار

هل تريد معرفة المزيد حول تسوية L1 وL2؟ توفر المقالة التالية مناقشة حول كيفية اختلاف تسوية L1 وL2 وكيفية تأثيرهما على ملاءمة النموذج، مع نماذج التعليمات البرمجية للانحدار اللوجستي ونماذج الشبكة العصبية: L1 وL2 الانتظام للتعلم الآلي

تم تصميم مجموعات خطية مختلفة من مصطلحات L1 وL2 لنماذج الانحدار اللوجستي: على سبيل المثال، تنظيم الشبكة المرنة. نقترح عليك الرجوع إلى هذه المجموعات لتحديد تركيبة خطية فعالة في النموذج الخاص بك.
بالنسبة لحجم الذاكرة لـ L-BFGS، حدد مقدار الذاكرة التي يجب استخدامها لتحسين L-BFGS.

L-BFGS يرمز إلى "ذاكرة محدودة Broyden-Fletcher-Goldfarb-Shanno". وهي خوارزمية تحسين شائعة لتقدير المعلمة. تشير هذه المعلمة إلى عدد المواضع والتدرجات السابقة التي يجب تخزينها لحساب الخطوة التالية.

تحد معلمة التحسين هذه من مقدار الذاكرة المستخدمة لحساب الخطوة والاتجاه التاليين. عند تحديد ذاكرة أقل، يكون التدريب أسرع ولكنه أقل دقة.
بالنسبة لقيمة الأرقام العشوائية، اكتب قيمة عدد صحيح. يعد تحديد قيمة أولية أمرًا مهما إذا كنت تريد أن تكون النتائج قابلة للتكرار عبر عمليات تشغيل متعددة لنفس المسار.
إضافة مجموعة بيانات مسماة إلى البنية الأساسية لبرنامج ربط العمليات التجارية، وتدريب النموذج:
- إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.
- إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامة وتدريب النموذج باستخدام ضبط المعلمات الفائقة للنموذج.
إشعار

إذا قمت بتمرير نطاق معلمة إلى نموذج التدريب، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكوّن ضبط المعلمات الفائقة للنموذج، عندما يتوقع نطاقًا من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

إذا قمت بتحديد الخيارنطاق المعلماتوأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.
إرسال البنية الأساسية.

النتائج

بعد انتهاء التدريب:

لإجراء تنبؤات على البيانات الجديدة، استخدم النموذج المدرب والبيانات الجديدة كإدخل إلى مكون Score Model.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.

مكون الانحدار اللوجستي Two-Class

حول الانحدار اللوجستي

كيفية التهيئة

النتائج

الخطوات التالية

الموارد الإضافية