مكوّن Boosted Decision Tree Regression

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكوّن لإنشاء مجموعة من أشجار التراجع باستخدام التعزيز. التعزيز يعني أن كل شجرة تعتمد على الأشجار السابقة. تتعلم الخوارزمية عن طريق توصيل بقايا الأشجار التي سبقتها. ومن ثمَّ، فإن التعزيز في مجموعة شجرة القرارات يميل إلى تحسين الدقة مع بعض المخاطر الصغيرة للتغطية الأقل.

يستند هذا المكوّن إلى خوارزمية LightGBM.

أسلوب التراجع هو أسلوب تعلم خاضع للإشراف، ومن ثمَّ يتطلب مجموعة بيانات مسماة. يجب أن يحتوي عمود التسمية على قيم رقمية.

ملاحظة

استخدم هذا المكوّن فقط مع مجموعات البيانات التي تستخدم المتغيرات الرقمية.

بعد تحديد النموذج، قم بتدريبه باستخدام نموذج التدريب.

المزيد حول أشجار التراجع المعززة

التعزيز هو واحد من العديد من الأساليب الكلاسيكية لإنشاء نماذج المجموعة، جنبًا إلى جنب مع التعبئة، والغابات العشوائية، وما إلى ذلك. في التعلم الآلي من Microsoft Azure، تستخدم أشجار القرارات المعززة تنفيذًا فعالاً لخوارزمية تعزيز تدرج MART. تعزيز التدرج هو تقنية التعلم الآلي لمشاكل التراجع. يقوم بإنشاء كل شجرة تراجع بطريقة خطوة بخطوة، باستخدام دالة خسارة محددة مسبقًا لقياس الخطأ في كل خطوة وتصحيحها في الخطوة التالية. ومن ثمَّ، فإن نموذج التنبؤ هو في الواقع مجموعة من نماذج التنبؤ الأضعف.

في مشكلات التراجع، يؤدي التعزيز إلى إنشاء سلسلة من الأشجار بطريقة خطوة بخطوة، ثم يحدد الشجرة المثلى باستخدام دالة خسارة عشوائية قابلة للاختلاف.

للحصول على معلومات إضافية، راجع هذه المقالات:

يمكن أيضًا استخدام أسلوب تعزيز التدرج لمشاكل التصنيف عن طريق تقليلها إلى التراجع باستخدام دالة خسارة مناسبة. لمزيد من المعلومات حول تنفيذ الأشجار المعززة لمهام التصنيف، راجع شجرة القرارات المعززة من فئتين.

كيفية تكوين مكوّن Boosted Decision Tree Regression

  1. أضف مكوّن Boosted Decision Tree إلى المسار الخاص بك. يمكنك العثور على هذا المكوّن ضمن التعلم الآلي، تهيئة، ضمن الفئة التراجع.

  2. حدد الطريقة التي تريد تدريب النموذج بها عن طريق تعيين خيار إنشاء وضع المدرب.

    • معلمة فردية: حدد هذا الخيار إذا كنت تعرف كيف تريد تكوين النموذج، وقم بتوفير مجموعة محددة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدًا من أفضل المعلمات، وتريد تشغيل مسح المعلمات. حدد نطاقًا من القيم للتكرار، وتتكرر مقاييس ضبط المعلمات الفائقة للنموذج عبر جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات الفائقة التي تنتج النتائج المثلى.

  3. الحد الأقصى لعدد الأوراق لكل شجرة: قم بالإشارة إلى الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

    من خلال زيادة هذه القيمة، من المحتمل أن تزيد من حجم الشجرة وتحصل على دقة أفضل، مع وجود خطر الإفراط في التوصيل ووقت التدريب الأطول.

  4. الحد الأدنى لعدد العينات لكل عقدة طرفية: قم بالإشارة إلى العدد الأدنى للحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.

    بزيادة هذه القيمة، يمكنك زيادة حد إنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، يمكن أن تتسبب حالة واحدة في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5، يجب أن تحتوي بيانات التدريب على 5 حالات على الأقل تستوفي نفس الشروط.

  5. معدل التعلم، اكتب رقمًا بين 0 و1 يحدد حجم الخطوة في أثناء التعلم. يحدد معدل التعلم مدى سرعة المتعلم أو بطئه في الاقتراب من الحل الأمثل. إذا كان حجم الخطوة كبيرًا جدًا، فقد تبالغ في استكشاف الحل الأمثل. إذا كان حجم الخطوة صغيرًا جدًا، يستغرق التدريب وقتًا أطول للاقتراب من أفضل حل.

  6. عدد الأشجار التي تم إنشاؤها: قم بالإشارة إلى العدد الإجمالي لأشجار القرارات المراد إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرارات، يمكنك الحصول على تغطية أفضل، ولكن يزيد وقت التدريب.

    ولكن، إذا قمت بتعيين القيمة إلى 1، يتم إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ولا يتم تنفيذ تكرارات أخرى.

  7. القيمة الأولية للعدد العشوائي: اكتب عددًا صحيحًا غير سالب من اختيارك لاستخدامه كقيمة أولية عشوائية. يضمن تحديد القيم الأولية إمكانية إعادة الإنتاج عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

    يتم تعيين القيم الأولية العشوائية بشكل افتراضي إلى 0، ما يعني أنه يتم الحصول على القيمة الأولية من ساعة النظام.

  8. تدريب النموذج:

    • إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.

    • إذا قمت بتعيينوضع إنشاء المدربلـنطاق المعلمات، فقم بتوصيل مجموعة البيانات ذات العلامة وتدريب النموذج باستخدامضبط المعلمات الفائقة للنموذج.

    ملاحظة

    إذا قمت بتمرير النطاق المتعلق بمعلمة إلىتدريب النموذج، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى المكونلضبط المعلمات الفائقة، عندما يتوقع نطاقاً من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

    إذا حددت الخيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  9. إرسال المسار.

النتائج

بعد انتهاء التدريب:

  • لاستخدام النموذج لتسجيل النقاط، قم بتوصيل نموذج التدريب بـ نموذج تسجيل النقاط، للتنبؤ بالقيم لأمثلة الإدخال الجديدة.

  • لحفظ لقطة للنموذج المدرب، حدد علامة التبويب المخرجات في اللوحة اليسرى للنموذج المدرب وانقر فوق تسجيل أيقونة تسجيل مجموعة البيانات. سيتم حفظ نسخة النموذج المدرب كمكوّن في شجرة المكوّن ولن يتم تحديثها على عمليات التشغيل المتتالية للمسار.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.