مكون Multiclass Decision Forest

توضح هذه المقالة مكونا في مصمم التعلم الآلي Azure.

استخدم هذا المكون لإنشاء نموذج تعلم آلي يعتمد على خوارزمية . إن decision forest نموذج تجميعي يبني بسرعة سلسلة من أشجار القرار، بينما يتعلم من البيانات ذات العلامات.

المزيد عن غابات القرار

تعد خوارزمية غابة القرار طريقة تعلم جماعية للتصنيف. تعمل الخوارزمية من خلال بناء أشجار قرارات متعددة ثم التصويت على فئة المخرجات الأكثر شيوعاً. التصويت هو شكل من أشكال التجميع، حيث تقوم كل شجرة في غابة قرارات التصنيف بإخراج مدرج تكراري غير طبيعي للتسميات. تجمع عملية التجميع هذه الرسوم البيانية وتسوية النتيجة للحصول على "الاحتمالات" لكل تسمية. الأشجار التي لديها ثقة عالية في التنبؤ لها وزن أكبر في القرار النهائي للمجموعة.

تعتبر أشجار القرار بشكل عام نماذج غير معلمية، ما يعني أنها تدعم البيانات بتوزيعات متنوعة. في كل شجرة، يتم إجراء سلسلة من الاختبارات البسيطة لكل فئة، ما يزيد من مستويات بنية الشجرة حتى يتم الوصول إلى عقدة ورقية (قرار).

تتمتع أشجار القرار بالعديد من المزايا:

  • يمكن أن تمثل حدود القرار غير الخطية.
  • فهي فعالة في الحساب واستخدام الذاكرة أثناء التدريب والتنبؤ.
  • يؤدون اختيار الميزات المتكاملة والتصنيف.
  • هم مرنون في وجود ميزات مزعجة.

يتكون مصنف غابة القرارات في التعلم الآلي من غابة من أشجار القرار. بشكل عام، توفر نماذج المجموعات تغطية ودقة أفضل من الأشجار ذات القرار الفردي. لمزيد من المعلومات، راجع أشجار القرار.

كيفية تكوين Multiclass Decision Forest

  1. أضف مكوِّن Multiclass Decision Forest إلى مسار التدفق الخاص بك في المصمم. يمكنك العثور على هذا المكون ضمن Machine Learning وInitialize Model وClassification.

  2. انقر نقراً مزدوجاً فوق المكون لفتح جزء Properties.

  3. بالنسبة إلى Resampling method، اختر الطريقة المستخدمة لإنشاء الأشجار الفردية. يمكنك الاختيار من بين التعبئة أو النسخ المتماثل.

    • Bagging: يُطلق على التعبئة أيضاً تجميع التمهيد. في هذه الطريقة، تتم زراعة كل شجرة على عينة جديدة، يتم إنشاؤها عن طريق أخذ عينات عشوائية من مجموعة البيانات الأصلية مع الاستبدال حتى تحصل على مجموعة بيانات بحجم الأصل. يتم دمج مخرجات النماذج عن طريق التصويت، وهو شكل من أشكال التجميع. لمزيد من المعلومات، راجع إدخال Wikipedia لتجميع Bootstrap.

    • تكرار: في النسخ المتماثل، يتم تدريب كل شجرة على نفس بيانات الإدخال بالضبط. يظل تحديد المسند المقسم المستخدم لكل عقدة شجرية عشوائياً، ما يؤدي إلى إنشاء أشجار متنوعة.

  4. حدد الطريقة التي تريد أن يتم بها تدريب النموذج، عن طريق تعيين الخيار إنشاء وضع المدرب.

    • معلمة واحدة: حدد هذا الخيار إذا كنت تعرف كيف تريد تكوين النموذج، وقم بتوفير مجموعة من القيم كوسائط.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكداً من أفضل المعلمات، وتريد تشغيل مسح المعلمات. حدد نطاقاً من القيم للتكرار مرة أخرى، وستقوم Tune Model Hyperparameters بالتكرار في جميع التركيبات الممكنة للإعدادات التي قدمتها لتحديد المعلمات التشعبية التي تنتج أفضل النتائج.

  5. عدد أشجار القرار: اكتب الحد الأقصى لعدد أشجار القرار التي يمكن إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار، يمكنك الحصول على تغطية أفضل، ولكن قد يزيد وقت التدريب.

    إذا قمت بتعيين القيمة على 1؛ ومع ذلك، هذا يعني أنه يمكن إنتاج شجرة واحدة فقط (الشجرة ذات المجموعة الأوَّلية من المعلمات)، ولا يتم إجراء أي تكرارات أخرى.

  6. أقصى عمق لأشجار القرار: اكتب رقماً للحد من أقصى عمق لأي شجرة قرارات. قد تؤدي زيادة عمق الشجرة إلى زيادة الدقة، مع خطر حدوث بعض التجهيز الزائد وزيادة وقت التدريب.

  7. عدد الانقسامات العشوائية لكل عقدة: اكتب عدد الانقسامات التي تريد استخدامها عند بناء كل عقدة في الشجرة. يعني الانقسام أن الميزات في كل مستوى من مستويات الشجرة (العقدة) مقسمة عشوائياً.

  8. الحد الأدنى لعدد العينات لكل عقدة طرفية: حدد الحد الأدنى لعدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقية) في شجرة. من خلال زيادة هذه القيمة، فإنك تزيد من حد إنشاء قواعد جديدة.

    على سبيل المثال، مع القيمة الافتراضية 1، يمكن أن تتسبب حالة واحدة في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5، يجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تستوفي نفس الشروط.

  9. قم بتوصيل مجموعة بيانات مصنفة، وقم بتدريب النموذج:

    • إذا قمت بتعيين Create trainer mode إلى Single Parameter، فقم بتوصيل مجموعة بيانات ذات علامة ومكون Train Model.

    • إذا قمت بتعيينوضع إنشاء المدربلـنطاق المعلمات، فقم بتوصيل مجموعة البيانات ذات العلامة وتدريب النموذج باستخدامضبط المعلمات الفائقة للنموذج.

    ملاحظة

    إذا قمت بتمرير النطاق المتعلق بمعلمة إلىتدريب النموذج، فإنه يستخدم القيمة الافتراضية فقط في قائمة المعلمات الفردية.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى المكونلضبط المعلمات الفائقة، عندما يتوقع نطاقاً من الإعدادات لكل معلمة، فإنه يتجاهل القيم ويستخدم القيم الافتراضية للمتعلم.

    إذا حددت الخيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  10. إرسال المسار.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.