الانحدار السريع للكمية في الغابة

توضح هذه المقالة وحدة نمطية في مصمم التعلم الآلي من Microsoft Azure.

استخدم هذا المكون لإنشاء نموذج الانحدار الكمي السريع للغابة في مسار التدفق. يعد الانحدار الكمي السريع للغابة مفيداً إذا كنت تريد فهم المزيد حول توزيع القيمة المتوقعة، بدلاً من الحصول على قيمة توقع متوسط ​​واحد. هذه الطريقة لها تطبيقات عديدة منها:

  • توقع الأسعار

  • تقدير أداء الطالب أو تطبيق مخططات النمو لتقييم نمو الطفل

  • اكتشاف العلاقات التنبئية في الحالات التي لا يوجد فيها سوى علاقة ضعيفة بين المتغيرات

تعد خوارزمية الانحدار طريقة تعلم خاضعة للإشراف، ما يعني أنها تتطلب مجموعة بيانات ذات علامات تتضمن عمود تصنيف. نظراً لأنها خوارزمية انحدار، يجب أن يحتوي عمود التسمية على قيم عددية فقط.

المزيد عن الانحدار الكمي

هناك أنواع مختلفة من الانحدار. ببساطة، الانحدار يعني ملاءمة نموذج لهدف يتم التعبير عنه كمتجه رقمي. ومع ذلك، فقد طور الإحصائيون طرقاً متقدمة بشكل متزايد للانحدار.

أبسط تعريف لـ quantile هو القيمة التي تقسم مجموعة من البيانات إلى مجموعات متساوية الحجم؛ وبالتالي، فإن القيم الكمية تحدد الحدود بين المجموعات. من الناحية الإحصائية، فإن الكميات هي قيم مأخوذة على فترات منتظمة من معكوس دالة التوزيع التراكمي (CDF) لمتغير عشوائي.

بينما تحاول نماذج الانحدار الخطي التنبؤ بقيمة متغير رقمي باستخدام تقدير واحد، المتوسط ​​، فأنت بحاجة أحياناً إلى التنبؤ بمدى أو التوزيع الكامل للمتغير المستهدف. تم تطوير تقنيات مثل الانحدار البايزي والانحدار الكمي لهذا الغرض.

يساعدك الانحدار الكمي على فهم توزيع القيمة المتوقعة. تتمتع نماذج الانحدار الكمي المستندة إلى الأشجار، مثل النموذج المستخدم في هذا المكون، بميزة إضافية تتمثل في إمكانية استخدامها للتنبؤ بالتوزيعات غير المعلمية.

كيفية تكوين Fast Forest Quantile Regression

  1. أضف مكون Fast Forest Quantile Regression إلى مسار التدفق الخاص بك في المصمم. يمكنك العثور على هذا المكون ضمن التعلم الآلي، في فئة Regression.

  2. في الجزء الأيمن من المكون Fast Forest Quantile Regression، حدد الطريقة التي تريد أن يتم تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع المدرب.

    • معلمة واحدة: إذا كنت تعرف كيف تريد تكوين النموذج، فقدم مجموعة محددة من القيم كوسائط. عند تدريب النموذج، استخدم Train Model.

    • نطاق المعلمات : إذا لم تكن متأكدًا من أفضل المعلمات، فقم باكتساح المعلمة باستخدام مكون Tune Model Hyperparameters . يقوم المدرب بتكرار القيم المتعددة التي تحددها للعثور على التكوين الأمثل.

  3. عدد الأشجار، اكتب الحد الأقصى لعدد الأشجار التي يمكن إنشاؤها في المجموعة. إذا قمت بإنشاء المزيد من الأشجار، فهذا يؤدي بشكل عام إلى مزيد من الدقة، ولكن على حساب وقت تدريب أطول.

  4. عدد الأوراق، اكتب الحد الأقصى لعدد الأوراق أو العقد الطرفية التي يمكن إنشاؤها في أي شجرة.

  5. الحد الأدنى لعدد مثيلات التدريب المطلوبة لتشكيل طرفية، حدد الحد الأدنى لعدد الأمثلة المطلوبة لإنشاء أي عقدة طرفية (طرفية) في شجرة.

    من خلال زيادة هذه القيمة، فإنك تزيد من حد إنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، يمكن أن تتسبب حالة واحدة في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5، يجب أن تحتوي بيانات التدريب على 5 حالات على الأقل تستوفي نفس الشروط.

  6. جزء التعبئة، حدد رقماً بين 0 و1 يمثل جزء العينات المراد استخدامه عند بناء كل مجموعة من الكميات. يتم اختيار العينات بشكل عشوائي مع الاستبدال.

  7. انقسام الكسر، اكتب رقماً بين 0 و1 يمثل جزء المعالم المراد استخدامه في كل تقسيم للشجرة. يتم دائماً اختيار الميزات المستخدمة بشكل عشوائي.

  8. الكميات المراد تقديرها، اكتب قائمة مفصولة بفاصلة منقوطة للكميات التي تريد أن يتدرب عليها النموذج وقم بإنشاء تنبؤات.

    على سبيل المثال، إذا كنت تريد إنشاء نموذج يقدر للربيعيات، فاكتب 0.25; 0.5; 0.75.

  9. اختيارياً، اكتب قيمة لـ مصدر الرقم العشوائي للبذور منشئ الأرقام العشوائية الذي يستخدمه النموذج. القيمة الافتراضية هي 0، ما يعني أنه تم اختيار بذرة عشوائية.

    يجب عليك تقديم قيمة إذا كنت بحاجة إلى إعادة إنتاج النتائج عبر عمليات التشغيل المتتالية على نفس البيانات.

  10. قم بتوصيل مجموعة بيانات التدريب والنموذج غير المدرب بأحد مكونات التدريب:

    تحذير

    • إذا قمت بتمرير نطاق المعلمات إلى نموذج التدريب ، فإنه يستخدم فقط القيمة الأولى في قائمة نطاق المعلمات.

    • إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، عندما تتوقع مجموعة من الإعدادات لكل معلمة، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    • إذا قمت بتحديد الخيارنطاق المعلماتوأدخلت قيمة واحدة لأي معلمة، يتم استخدام هذه القيمة المفردة التي حددتها طوال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  11. إرسال البنية الأساسية.

النتائج

بعد انتهاء التدريب:

  • لحفظ لقطة من النموذج المدرب، حدد مكون التدريب، ثم تبديل إلى مخرجات + سجل علامة تبويب في اللوحة اليمنى. انقر على الأيقونة سجل مجموعة البيانات . يمكنك العثور على النموذج المحفوظ كمكون في شجرة المكونات.

مقاييس تقييم

يمكنك استخدام مكون Evaluate Model لتقييم النموذج المدرب. بالنسبة إلى الانحدار الكمي للغابة السريعة، تكون المقاييس كما يلي.

  • خسارة كمية: هذا مقياس للخطأ لكمية محددة في النموذج الخاص بك.
  • متوسط الخسارة الكمية: هذا هو ببساطة متوسط قيم خسارة الكمية عبر جميع القيم الكمية المدروسة في النموذج. فهو يعطي مقياسا إجماليا لمدى جودة أداء النموذج عبر جميع الكمية.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.