مكون الانحدار الخطي

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج انحدار خطي لاستخدامه في البنية الأساسية لبرنامج ربط العمليات التجارية. يحاول الانحدار الخطي إنشاء علاقة خطية بين متغير واحد أو أكثر من المتغيرات المستقلة والنتيجة الرقمية أو المتغير التابع.

يمكنك استخدام هذا المكون لتعريف أسلوب انحدار خطي، ثم تدريب نموذج باستخدام مجموعة بيانات مسماة. يمكن بعد ذلك استخدام النموذج المدرب لإجراء تنبؤات.

نبذة عن الانحدار الخطي

الانحدار الخطي هو أسلوب إحصائي شائع، تم اعتماده في التعلم الآلي وتعزيزه بالعديد من الطرق الجديدة لملاءمة الخط وقياس الخطأ. ببساطة، يشير الانحدار إلى توقع هدف رقمي. لا يزال الانحدار الخطي خيارًا جيدًا عندما تريد نموذجًا بسيطًا لمهمة تنبؤية أساسية. يميل الانحدار الخطي أيضًا إلى العمل بشكل جيد على مجموعات البيانات عالية الأبعاد والمتباينة التي تفتقر إلى التعقيد.

يدعم التعلم الآلي من Azure مجموعة متنوعة من نماذج الانحدار، بالإضافة إلى الانحدار الخطي. ومع ذلك، يمكن تفسير مصطلح "الانحدار" بشكل أعم، وبعض أنواع الانحدار المتوفرة في أدوات أخرى غير مدعومة.

  • تتضمن مشكلة الانحدار الكلاسيكي متغيرًا مستقلًا واحدًا ومتغيرًا تابعًا. وهذا ما يسمى الانحدار البسيط. يدعم هذا المكون الانحدار البسيط.

  • الانحدار الخطي المتعدد يتضمن متغيرين مستقلين أو أكثر تساهم في متغير تابع واحد. تسمى المشكلات التي يتم فيها استخدام مدخلات متعددة للتنبؤ بنتيجة رقمية واحدة أيضًا الانحدار الخطي متعدد المتغيرات.

    يستطيع مكون الانحدار الخطي حل هذه المشاكل، كما هي الحال بالنسبة لمعظم مكونات الانحدار الأخرى.

  • الانحدار متعدد التسميات هو مهمة التنبؤ بمتغيرات تابعة متعددة داخل نموذج واحد. على سبيل المثال، في الانحدار اللوجستي متعدد التسميات، يمكن تعيين عينة إلى تسميات مختلفة متعددة. (يختلف هذا عن مهمة التنبؤ بمستويات متعددة داخل متغير فئوي واحد).

    هذا النوع من الانحدار غير مدعوم في التعلم الآلي من Azure. للتنبؤ بمتغيرات متعددة، قم بإنشاء متعلم منفصل لكل إخراج ترغب في التنبؤ به.

ومع ذلك، فقد طور الإحصائيون طرقاً متقدمة بشكل متزايد للانحدار. هذا صحيح حتى بالنسبة للانحدار الخطي. يدعم هذا المكون طريقتين لقياس الخطأ واحتواء خط الانحدار: أسلوب المربعات الصغرى العادية، والانحدار المتدرج.

  • الانحدار المتدرج هو أسلوب يقلل من مقدار الخطأ في كل خطوة من عملية تدريب النموذج. هناك العديد من الاختلافات على الانحدار المتدرج وتم دراسة تحسينه لمشاكل التعلم المختلفة على نطاق واسع. إذا اخترت هذا الخيار بصفته أسلوب الحل، فإنه يمكنك تعيين مجموعة متنوعة من المعلمات للتحكم في حجم الخطوة ومعدل التعلم وما إلى ذلك. يدعم هذا الخيار أيضًا استخدام مسح معلمات متكامل.

  • المربعات الصغرى العادية هي واحدة من التقنيات الأكثر استخدامًا في الانحدار الخطي. على سبيل المثال، المربعات الصغرى هي الطريقة المستخدمة في حزمة Analysis Toolpak for Microsoft Excel.

    تشير المربعات الصغرى العادية إلى دالة الخسارة، التي تحسب الخطأ كمجموع مربع المسافة من القيمة الفعلية إلى السطر المتوقع، وتلائم النموذج عن طريق تقليل الخطأ التربيعي. يفترض هذا الأسلوب علاقة خطية قوية بين المدخلات والمتغير التابع.

تكوين الانحدار الخطي

يدعم هذا المكون طريقتين لتركيب نموذج الانحدار، مع خيارات مختلفة:

إنشاء نموذج الانحدار باستخدام المربعات الصغرى العادية

  1. أضف مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية في المصمم.

    يمكنك العثور على هذا المكون ضمن فئة التعلم الآلي. قم بتوسيع تهيئة النموذج، وتوسيع الانحدار، ثم اسحب مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك.

  2. في جزء الخصائص، في القائمة المنسدلة أسلوب الحل، حدد المربعات الصغرى العادية. يحدد هذا الخيار أسلوب الحساب المستخدم للعثور على خط الانحدار.

  3. في وزن تنظيم L2، اكتب القيمة لاستخدامها كوزن لإضفاء الطابع المنتظم على L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في الاحتواء.

    لمعرفة المزيد حول كيفية تأثير الانتظام على ملاءمة النموذج، راجع هذه المقالة: انتظام L1 وL2 للتعلم الآلي

  4. حدد الخيار، تضمين مصطلح التقاطع، إذا كنت تريد عرض مصطلح التقاطع.

    قم بإلغاء تحديد هذا الخيار إذا لم تكن بحاجة إلى مراجعة صيغة الانحدار.

  5. بالنسبة إلى قيمة الأرقام العشوائية، يمكنك كتابة قيمة اختياريًا لزرع منشئ الأرقام العشوائي الذي يستخدمه النموذج.

    يعد استخدام قيمة أولية مفيدًا إذا كنت تريد الاحتفاظ بنفس النتائج عبر عمليات تشغيل مختلفة لنفس البنية الأساسية لبرنامج ربط العمليات التجارية. وإلا، فإن الإعداد الافتراضي هو استخدام قيمة من ساعة النظام.

  6. أضف مكون نموذج التدريب إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك، وقم بتوصيل مجموعة بيانات مسماة.

  7. إرسال المسار.

نتائج نموذج المربعات الصغرى العادية

بعد انتهاء التدريب:

  • لإجراء تنبؤات، قم بتوصيل النموذج المدرب بمكون نموذج الدرجة، إلى جانب مجموعة بيانات من القيم الجديدة.

إنشاء نموذج انحدار باستخدام الانحدار المتدرج عبر الإنترنت

  1. أضف مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية في المصمم.

    يمكنك العثور على هذا المكون ضمن فئة التعلم الآلي. قم بتوسيع تهيئة النموذج، وتوسيع الانحدار، ثم اسحب مكون نموذج الانحدار الخطي إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك.

  2. في جزء الخصائص، في القائمة المنسدلة أسلوب الحل، اختر الانحدار المتدرج عبر الإنترنت كأسلوب حساب يستخدم للعثور على خط الانحدار.

  3. لإنشاء وضع المدرب، حدد ما إذا كنت تريد تدريب النموذج باستخدام مجموعة محددة مسبقا من المعلمات، أو إذا كنت تريد تحسين النموذج باستخدام مسح المعلمات.

    • معلمة واحدة: إذا كنت تعرف كيف تريد تكوين شبكة الانحدار الخطيّ، يمكنك توفير مجموعة معينة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدًا من أفضل المعلمات، وتريد تشغيل مسح المعلمات. حدد نطاقاً من القيم للتكرار، وتتكرر مقاييس ضبط نموذج Hyperparameters عبر جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات الفائقة التي تنتج النتائج المثلى.

  4. بالنسبة إلى معدل التعلم، حدد معدل التعلم الأولي لمحسن الانحدار المتدرج العشوائي.

  5. بالنسبة إلى عدد فترات التدريب، اكتب قيمة تشير إلى عدد المرات التي يجب أن تتكرر فيها الخوارزمية من خلال الأمثلة. بالنسبة لمجموعات البيانات التي تتضمن عددًا صغيرًا من الأمثلة، يجب أن يكون هذا العدد كبيرًا للوصول إلى التقارب.

  6. تسوية الميزات: إذا كنت قد قمت بالفعل بتسوية البيانات الرقمية المستخدمة لتدريب النموذج، يمكنك إلغاء تحديد هذا الخيار. بشكل افتراضي، يقوم المكون بتسوية جميع المدخلات الرقمية إلى نطاق بين 0 و1.

    ملاحظة

    تذكر تطبيق نفس أسلوب التسوية على البيانات الجديدة المستخدمة لتسجيل النقاط.

  7. في وزن تنظيم L2، اكتب القيمة لاستخدامها كوزن لإضفاء الطابع المنتظم على L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في الاحتواء.

    لمعرفة المزيد حول كيفية تأثير الانتظام على ملاءمة النموذج، راجع هذه المقالة: انتظام L1 وL2 للتعلم الآلي

  8. حدد الخيار، تقليل معدل التعلم، إذا كنت تريد أن ينخفض معدل التعلم مع تقدم التكرارات.

  9. بالنسبة إلى قيمة الأرقام العشوائية، يمكنك كتابة قيمة اختياريًا لزرع منشئ الأرقام العشوائي الذي يستخدمه النموذج. يعد استخدام قيمة أولية مفيدًا إذا كنت تريد الاحتفاظ بنفس النتائج عبر عمليات تشغيل مختلفة لنفس البنية الأساسية لبرنامج ربط العمليات التجارية.

  10. تدريب النموذج:

    • إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.

    • إذا قمت بتعيينوضع إنشاء المدربلـنطاق المعلمات، فقم بتوصيل مجموعة البيانات ذات العلامة وتدريب النموذج باستخدامضبط المعلمات الفائقة للنموذج.

    ملاحظة

    إذا قمت بتمرير النطاق المتعلق بمعلمة إلىتدريب النموذج، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى المكونلضبط المعلمات الفائقة، عندما يتوقع نطاقاً من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

    إذا حددت الخيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  11. إرسال المسار.

نتائج الانحدار المتدرج عبر الإنترنت

بعد انتهاء التدريب:

  • لإجراء تنبؤات، قم بتوصيل النموذج المدرب بمكون نموذج الدرجة، إلى جانب بيانات الإدخال الجديدة.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.