شجرة قرار معززة متعددة الطبقات

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج تعلم آلي يستند إلى خوارزمية أشجار القرار المعززة.

شجرة القرار المعززة هي طريقة تعلم جماعية تصحح فيها الشجرة الثانية أخطاء الشجرة الأولى، وتصحح الشجرة الثالثة لأخطاء الشجرة الأولى والثانية، وهكذا دواليك. تستند التنبؤات إلى مجموعة الأشجار معاً.

كيفية التهيئة

ينشئ هذا المكون نموذج تصنيف غير مدرب. نظراً لأن التصنيف هو أسلوب تعلم خاضع للإشراف، فأنت بحاجة إلى مجموعة بيانات مسماة تتضمن عمود تسمية بقيمة لكافة الصفوف.

يمكنك تدريب هذا النوع من النماذج باستخدام نموذج التدريب.

  1. أضف مكون Multiclass Boosted Decision Tree إلى المسار الخاص بك.

  2. حدد الطريقة التي تريد تدريب النموذج بها عن طريق تعيين خيار إنشاء وضع المدرب.

    • معلمة واحدة: إذا كنت تعرف كيف تريد تكوين النموذج، يمكنك توفير مجموعة معينة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل مسح المعلمات. حدد نطاقاً من القيم للتكرار، وتتكرر مقاييس ضبط نموذج Hyperparameters عبر جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات الفائقة التي تنتج النتائج المثلى.

  3. الحد الأقصى لعدد الأوراق لكل شجرة يحد من الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

    من خلال زيادة هذه القيمة، من المحتمل أن تزيد من حجم الشجرة وتحقق دقة أعلى، في خطر الإفراط في التصغير ووقت التدريب الأطول.

  4. يشير الحد الأدنى لعدد العينات لكل عقدة طرفية إلى عدد الحالات المطلوبة لإنشاء أي عقدة طرفية (طرفية) في شجرة.

    بزيادة هذه القيمة، يمكنك زيادة حد إنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، يمكن أن تتسبب حالة واحدة في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5، يجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تفي بنفس الشروط.

  5. يحدد معدل التعلم حجم الخطوة أثناء التعلم. أدخل رقماً يتراوح بين 0 و 1.

    يحدد معدل التعلم مدى سرعة أو بطء التلاقي بين المتعلم والحل الأمثل. إذا كان حجم الخطوة كبيراً جداً، فقد تبالغ في استكشاف الحل الأمثل. إذا كان حجم الخطوة صغيراً جداً، يستغرق التدريب وقتاً أطول للتقارب على أفضل حل.

  6. يشير عدد الأشجار التي تم إنشاؤها إلى العدد الإجمالي لأشجار القرار المراد إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار، يمكنك الحصول على تغطية أفضل، ولكن سيزداد وقت التدريب.

  7. تعيين القيمة الأولية للعدد العشوائي اختيارياً عدداً صحيحاً غير سالب لاستخدامه كقيمة أولية عشوائية. يضمن تحديد البذور إمكانية إعادة الإنتاج عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

    يتم تعيين البذور العشوائية بشكل افتراضي إلى 42. يمكن أن يكون للأشواط المتتالية باستخدام بذور عشوائية مختلفة نتائج مختلفة.

  8. تدريب النموذج:

    • إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.

    • إذا قمت بتعيينوضع إنشاء المدربلـنطاق المعلمات، فقم بتوصيل مجموعة البيانات ذات العلامة وتدريب النموذج باستخدامضبط المعلمات الفائقة للنموذج.

    ملاحظة

    إذا قمت بتمرير النطاق المتعلق بمعلمة إلىتدريب النموذج، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى المكونلضبط المعلمات الفائقة، عندما يتوقع نطاقاً من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد الخيارنطاق المعلماتوأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.