مكون شجرة القرار المعزز Two-Class

مقالة
06/01/2023

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج تعلم آلي يستند إلى خوارزمية أشجار القرار المعززة.

شجرة القرار المعززة هي طريقة تعلم جماعية تصحح فيها الشجرة الثانية أخطاء الشجرة الأولى، وتصحح الشجرة الثالثة لأخطاء الشجرة الأولى والثانية، وهكذا دواليك. تستند التنبؤات إلى مجموعة الأشجار بأكملها معا التي تجعل التنبؤ.

بشكل عام، عند تكوينها بشكل صحيح، فإن أشجار القرار المعززة هي أسهل الطرق التي يمكن من خلالها الحصول على أعلى أداء على مجموعة واسعة من مهام التعلم الآلي. ومع ذلك، فهي أيضا واحدة من المتعلمين الأكثر كثافة في الذاكرة، والتنفيذ الحالي يحتفظ بكل شيء في الذاكرة. لذلك، قد لا يتمكن نموذج شجرة القرار المعزز من معالجة مجموعات البيانات الكبيرة التي يمكن لبعض المتعلمين الخطيين التعامل معها.

يستند هذا المكون إلى خوارزمية LightGBM.

كيفية التهيئة

ينشئ هذا المكون نموذج تصنيف غير مدرب. نظرًا لأن التصنيف هو أسلوب تعلم خاضع للإشراف، لتدريب النموذج، تحتاج إلى مجموعة بيانات ذات علامة تتضمن عمود تسمية بقيمة لجميع الصفوف.

يمكنك تدريب هذا النوع من النماذج باستخدام Train Model.

في التعلم الآلي من Azure، أضف مكون شجرة القرارات المعززة إلى البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بك.
حدد الطريقة التي تريد تدريب النموذج بها عن طريق تعيين خيار إنشاء وضع المدرب.
- معلمة واحدة: إذا كنت تعرف كيف تريد تكوين النموذج، يمكنك توفير مجموعة معينة من القيم كوسيطات.
- نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات، يمكنك العثور على المعلمات المثلى باستخدام مكون Tune Model Hyperparameters. يمكنك توفير بعض مجموعة من القيم، ويكرر المدرب على مجموعات متعددة من الإعدادات لتحديد مجموعة القيم التي تنتج أفضل نتيجة.
بالنسبة إلى الحد الأقصى لعدد الأوراق لكل شجرة، قم بالإشارة إلى الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

من خلال زيادة هذه القيمة، من المحتمل أن تزيد من حجم الشجرة وتحصل على دقة أفضل، في خطر الإفراط في الإعداد ووقت التدريب الأطول.
بالنسبة إلى الحد الأدنى لعدد العينات لكل عقدة طرفية، قم بالإشارة إلى عدد الحالات المطلوبة لإنشاء أي عقدة طرفية (طرفية) في شجرة.

بزيادة هذه القيمة، يمكنك زيادة حد إنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، يمكن أن تتسبب حالة واحدة في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5، يجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تفي بنفس الشروط.
بالنسبة إلى معدل التعلم، اكتب رقما بين 0 و1 يحدد حجم الخطوة أثناء التعلم.

يحدد معدل التعلم مدى سرعة المتعلم أو بطئه في التقارب على الحل الأمثل. إذا كان حجم الخطوة كبيراً جداً، فقد تبالغ في استكشاف الحل الأمثل. إذا كان حجم الخطوة صغيراً جداً، يستغرق التدريب وقتاً أطول للتقارب على أفضل حل.
بالنسبة إلى عدد الأشجار التي تم إنشاؤها، قم بالإشارة إلى العدد الإجمالي لأشجار القرار المراد إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار، يمكنك الحصول على تغطية أفضل، ولكن سيزداد وقت التدريب.

إذا قمت بتعيين القيمة إلى 1، يتم إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ولا يتم تنفيذ تكرارات أخرى.
بالنسبة لقيمة الأرقام العشوائية، اكتب اختياريًا عددًا صحيحصا غير سالب لاستخدامه كقيمة أولية عشوائية. يضمن تحديد البذور إمكانية إعادة الإنتاج عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

يتم تعيين البذور العشوائية بشكل افتراضي إلى 0، ما يعني أنه يتم الحصول على قيمة البذور الأولية من ساعة النظام. يمكن أن يكون للشواط المتتالية باستخدام بذور عشوائية نتائج مختلفة.
تدريب النموذج:
- إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.
- إذا قمت بتعيينوضع إنشاء المدربلـنطاق المعلمات، فقم بتوصيل مجموعة البيانات ذات العلامة وتدريب النموذج باستخدامضبط المعلمات الفائقة للنموذج.
ملاحظة

إذا قمت بتمرير النطاق المتعلق بمعلمة إلىتدريب النموذج، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى المكونلضبط المعلمات الفائقة، عندما يتوقع نطاقاً من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

إذا حددت الخيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

النتائج

بعد انتهاء التدريب:

لحفظ لقطة للنموذج المدرب، حدد علامة التبويب Outputs في اللوحة اليمنى لمكون نموذج Train. حدد أيقونة تسجيل مجموعة البيانات لحفظ النموذج كمكوِّن قابل لإعادة الاستخدام.
لاستخدام النموذج لتسجيل النقاط، أضف مكون Score Model إلى البنية الأساسية لبرنامج ربط العمليات التجارية.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.

مكون شجرة القرار المعزز Two-Class

كيفية التهيئة

النتائج

الخطوات التالية

الموارد الإضافية