مكون الانحدار الخطي

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج انحدار خطي للاستخدام في البنية الأساسية لبرنامج ربط العمليات التجارية. يحاول التراجع الخطي إنشاء علاقة خطية بين متغير واحد أو أكثر من المتغيرات المستقلة والنتيجة الرقمية أو المتغير التابع.

يمكنك استخدام هذا المكون لتعريف أسلوب انحدار خطي، ثم تدريب نموذج باستخدام مجموعة بيانات مسماة. يمكن بعد ذلك استخدام النموذج المدرب لإجراء تنبؤات.

حول الانحدار الخطي

الانحدار الخطي هو أسلوب إحصائي شائع، تم اعتماده في التعلم الآلي وتعزيزه بالعديد من الطرق الجديدة لملاءمة الخط وقياس الخطأ. ببساطة، يشير الانحدار إلى التنبؤ بهدف رقمي. لا يزال التراجع الخطي خيارا جيدا عندما تريد نموذجا بسيطا لمهمة تنبؤية أساسية. يميل الانحدار الخطي أيضا إلى العمل بشكل جيد على مجموعات البيانات عالية الأبعاد والمتباينة التي تفتقر إلى التعقيد.

يدعم التعلم الآلي من Microsoft Azure مجموعة متنوعة من نماذج الانحدار، بالإضافة إلى الانحدار الخطي. ومع ذلك، يمكن تفسير مصطلح "الانحدار" تفسيرا فضفاضا، وبعض أنواع الانحدار المقدمة في أدوات أخرى غير مدعومة.

  • تتضمن مشكلة الانحدار الكلاسيكية متغيرا مستقلا واحدا ومتغيرا تابعا. وهذا ما يسمى الانحدار البسيط. يدعم هذا المكون التراجع البسيط.

  • يتضمن التراجع الخطي المتعدد متغيرين مستقلين أو أكثر يساهمان في متغير تابع واحد. تسمى المشكلات التي يتم فيها استخدام مدخلات متعددة للتنبؤ بنتيجة رقمية واحدة أيضا التراجع الخطي متعدد المتغيرات.

    يمكن لمكون الانحدار الخطي حل هذه المشكلات، كما يمكن لمعظم مكونات الانحدار الأخرى.

  • التراجع متعدد التسميات هو مهمة التنبؤ بمتغيرات تابعة متعددة داخل نموذج واحد. على سبيل المثال، في الانحدار اللوجستي متعدد التسميات، يمكن تعيين عينة إلى تسميات مختلفة متعددة. (يختلف هذا عن مهمة التنبؤ بمستويات متعددة داخل متغير فئة واحدة.)

    هذا النوع من التراجع غير مدعوم في التعلم الآلي من Microsoft Azure. للتنبؤ بمتغيرات متعددة، قم بإنشاء متعلم منفصل لكل إخراج ترغب في التنبؤ به.

على مدى سنوات، كان الإحصائيون يطورون أساليب متقدمة بشكل متزايد للتراجع. هذا صحيح حتى بالنسبة للتراجع الخطي. يدعم هذا المكون طريقتين لقياس الخطأ واحتواء خط الانحدار: أسلوب المربعات الأقل العادي، والنزول المتدرج.

  • الانخفاض المتدرج هو أسلوب يقلل من مقدار الخطأ في كل خطوة من خطوات عملية تدريب النموذج. هناك العديد من الاختلافات على الانخفاض المتدرج وتم دراسة تحسينه لمشاكل التعلم المختلفة على نطاق واسع. إذا اخترت هذا الخيار لأسلوب الحل، يمكنك تعيين مجموعة متنوعة من المعلمات للتحكم في حجم الخطوة ومعدل التعلم وما إلى ذلك. يدعم هذا الخيار أيضا استخدام مسح معلمة متكامل.

  • المربعات الأقل عادية هي واحدة من التقنيات الأكثر استخداما في الانحدار الخطي. على سبيل المثال، المربعات الأقل هي الطريقة المستخدمة في حزمة أدوات التحليل ل Microsoft Excel.

    تشير المربعات الأقل عادية إلى دالة الخسارة، التي تحسب الخطأ كمجموع مربع المسافة من القيمة الفعلية إلى السطر المتوقع، وتلائم النموذج عن طريق تقليل الخطأ التربيعي. يفترض هذا الأسلوب علاقة خطية قوية بين المدخلات والمتغير التابع.

تكوين الانحدار الخطي

يدعم هذا المكون طريقتين لتركيب نموذج الانحدار، مع خيارات مختلفة:

إنشاء نموذج انحدار باستخدام المربعات الأقل عادية

  1. أضف مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك في المصمم.

    يمكنك العثور على هذا المكون في فئة التعلم الآلي . قم بتوسيع Initialize Model، وقم بتوسيع Regression، ثم اسحب مكون Linear Regression Model إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك.

  2. في جزء Properties ، في القائمة المنسدلة Solution method ، حدد عادية الأقل مربعات. يحدد هذا الخيار أسلوب الحساب المستخدم للعثور على خط الانحدار.

  3. في وزن الانتظام L2، اكتب القيمة لاستخدامها كوزن للانتظام L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في الماحتواء.

    لمعرفة المزيد حول كيفية تأثير الانتظام على ملاءمة النموذج، راجع هذه المقالة: L1 وL2 الانتظام للتعلم الآلي

  4. حدد الخيار تضمين مصطلح التقاطع، إذا كنت تريد عرض مصطلح التقاطع.

    قم بإلغاء تحديد هذا الخيار إذا لم تكن بحاجة إلى مراجعة صيغة الانحدار.

  5. بالنسبة لقيمة الأرقام العشوائية، يمكنك اختياريا كتابة قيمة لزرع منشئ الأرقام العشوائي الذي يستخدمه النموذج.

    يعد استخدام قيمة أولية مفيدا إذا كنت تريد الاحتفاظ بنفس النتائج عبر عمليات تشغيل مختلفة لنفس المسار. وإلا، فإن الإعداد الافتراضي هو استخدام قيمة من ساعة النظام.

  6. أضف مكون Train Model إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك، وقم بتوصيل مجموعة بيانات مسماة.

  7. إرسال البنية الأساسية.

نتائج نموذج المربعات الأقل العادي

بعد اكتمال التدريب:

  • لإجراء تنبؤات، قم بتوصيل النموذج المدرب بمكون Score Model ، جنبا إلى جنب مع مجموعة بيانات من القيم الجديدة.

إنشاء نموذج انحدار باستخدام الانخفاض المتدرج عبر الإنترنت

  1. أضف مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك في المصمم.

    يمكنك العثور على هذا المكون في فئة التعلم الآلي . قم بتوسيع تهيئة النموذج، وتوسيع الانحدار، واسحب مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك

  2. في جزء Properties ، في القائمة المنسدلة Solution method ، اختر Online Gradient Descent كأسلوب حساب يستخدم للعثور على خط الانحدار.

  3. لإنشاء وضع المدرب، حدد ما إذا كنت تريد تدريب النموذج باستخدام مجموعة محددة مسبقا من المعلمات، أو إذا كنت تريد تحسين النموذج باستخدام مسح المعلمات.

    • معلمة واحدة: إذا كنت تعرف كيف تريد تكوين شبكة الانحدار الخطي، يمكنك توفير مجموعة معينة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل مسح معلمة. حدد نطاقا من القيم للتكرار، ويتكرر Tune Model Hyperparameters عبر جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات الفائقة التي تنتج النتائج المثلى.

  4. بالنسبة إلى معدل التعلم، حدد معدل التعلم الأولي لمحسن الانخفاض المتدرج العشوائي.

  5. بالنسبة إلى عدد فترات التدريب، اكتب قيمة تشير إلى عدد المرات التي يجب أن تتكرر فيها الخوارزمية من خلال الأمثلة. بالنسبة لمجموعات البيانات التي تتضمن عددا صغيرا من الأمثلة، يجب أن يكون هذا العدد كبيرا للوصول إلى التقارب.

  6. تطبيع الميزات: إذا كنت قد قمت بالفعل بتسوية البيانات الرقمية المستخدمة لتدريب النموذج، يمكنك إلغاء تحديد هذا الخيار. بشكل افتراضي، يقوم المكون بتطبيع جميع المدخلات الرقمية إلى نطاق بين 0 و1.

    ملاحظة

    تذكر تطبيق نفس أسلوب التسوية على البيانات الجديدة المستخدمة لتسجيل النقاط.

  7. في وزن الانتظام L2، اكتب القيمة لاستخدامها كوزن للانتظام L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في الماحتواء.

    لمعرفة المزيد حول كيفية تأثير الانتظام على ملاءمة النموذج، راجع هذه المقالة: L1 وL2 الانتظام للتعلم الآلي

  8. حدد الخيار تقليل معدل التعلم، إذا كنت تريد أن ينخفض معدل التعلم مع تقدم التكرارات.

  9. بالنسبة لقيمة الأرقام العشوائية، يمكنك اختياريا كتابة قيمة لزرع منشئ الأرقام العشوائي الذي يستخدمه النموذج. يعد استخدام قيمة أولية مفيدا إذا كنت تريد الاحتفاظ بنفس النتائج عبر عمليات تشغيل مختلفة لنفس المسار.

  10. تدريب النموذج:

    • إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model .

    • إذا قمت بتعيين وضع إنشاء مدرب إلى Parameter Range، فقم بتوصيل مجموعة بيانات ذات علامة وتدريب النموذج باستخدام Tune Model Hyperparameters.

    ملاحظة

    إذا قمت بتمرير نطاق معلمة إلى Train Model، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، عندما تتوقع نطاقا من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

    إذا حددت الخيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  11. إرسال البنية الأساسية.

نتائج الانخفاض المتدرج عبر الإنترنت

بعد اكتمال التدريب:

  • لإجراء تنبؤات، قم بتوصيل النموذج المدرب بمكون Score Model ، جنبا إلى جنب مع بيانات الإدخال الجديدة.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.