مسح النموذج وتحديده للتنبؤ في AutoML

تركز هذه المقالة على كيفية بحث AutoML عن نماذج التنبؤ وتحديدها. يرجى الاطلاع على مقالة نظرة عامة على الأساليب للحصول على مزيد من المعلومات العامة حول منهجية التنبؤ في AutoML. يمكن العثور على إرشادات وأمثلة لنماذج تنبؤ التدريب في AutoML في مقالة التنبؤ بالسلاسل الزمنية لإعداد AutoML الخاص بنا.

مسح النموذج

المهمة المركزية ل AutoML هي تدريب وتقييم العديد من النماذج واختيار أفضل نموذج فيما يتعلق بالمقياس الأساسي المحدد. تشير كلمة "model" هنا إلى كل من فئة النموذج - مثل ARIMA أو Random Forest - وإعدادات المعلمة الفائقة المحددة التي تميز النماذج داخل فئة. على سبيل المثال، يشير ARIMA إلى فئة من النماذج التي تشترك في قالب رياضي ومجموعة من الافتراضات الإحصائية. يتطلب التدريب، أو المناسب، نموذج ARIMA قائمة بالأعداد الصحيحة الإيجابية التي تحدد الشكل الرياضي الدقيق للنموذج؛ هذه هي المعلمات الفائقة. ARIMA(1, 0, 1) و ARIMA(2, 1, 2) لها نفس الفئة، ولكن المعلمات الفائقة المختلفة، لذلك، يمكن أن تكون مناسبة بشكل منفصل مع بيانات التدريب وتقييمها ضد بعضها البعض. يقوم AutoML بالبحث أو المسح عبر فئات نماذج مختلفة وداخل الفئات من خلال معلمات تشعبية مختلفة.

يعرض الجدول التالي أساليب مسح المعلمات الفائقة المختلفة التي يستخدمها AutoML لفئات النموذج المختلفة:

مجموعة فئة النموذج نوع النموذج أسلوب مسح المعلمات الفائقة
سذاجة، سذاجة موسمية، متوسط، متوسط موسمي السلاسل الزمنية لا تجتاح داخل الفئة بسبب بساطة النموذج
التجانس الأسي، ARIMA(X) السلاسل الزمنية البحث عن الشبكة للمسح داخل الفئة
Prophet تراجع لا يوجد مسح داخل الفئة
SGD الخطي، LARS LASSO، Elastic Net، K أقرب الجيران، شجرة القرار، الغابة العشوائية، الأشجار العشوائية للغاية، الأشجار المعززة المتدرجة، LightGBM، XGBoost تراجع تستكشف خدمة توصية نموذج AutoML بشكل ديناميكي مساحات المعلمات الفائقة
ForecastTCN تراجع قائمة ثابتة بالنماذج متبوعة بالبحث العشوائي عبر حجم الشبكة ونسبة التسرب ومعدل التعلم.

للحصول على وصف أنواع النماذج المختلفة، راجع قسم نماذج التنبؤ في مقالة نظرة عامة على الأساليب.

يعتمد مقدار المسح الذي يقوم به AutoML على تكوين مهمة التنبؤ. يمكنك تحديد معايير الإيقاف كحد زمني أو حد لعدد الإصدارات التجريبية، أو ما يعادل عدد النماذج. يمكن استخدام منطق الإنهاء المبكر في كلتا الحالتين لإيقاف المسح إذا لم يتحسن المقياس الأساسي.

تحديد النموذج

يستمر البحث عن نموذج التنبؤ التلقائي والاختيار في المراحل الثلاث التالية:

  1. امسح نماذج السلاسل الزمنية وحدد أفضل نموذج من كل فئة باستخدام أساليب الاحتمال المعاقب عليها.
  2. قم بمسح نماذج الانحدار وترتيبها، جنبا إلى جنب مع أفضل نماذج السلاسل الزمنية من المرحلة 1، وفقا لقيم المقاييس الأساسية الخاصة بها من مجموعات التحقق من الصحة.
  3. إنشاء نموذج مجموعة من أعلى النماذج مرتبة، وحساب مقياس التحقق من الصحة الخاص به، وترتيبه مع النماذج الأخرى.

يتم تعيين النموذج الذي يحتوي على أعلى قيمة قياس مرتبة في نهاية المرحلة 3 أفضل نموذج.

هام

تحسب المرحلة النهائية من تحديد النموذج في AutoML دائما المقاييس على البيانات خارج العينة . أي البيانات التي لم يتم استخدامها لاحتواء النماذج. يساعد هذا على الحماية من الإفراط في التركيب.

يحتوي AutoML على تكوينين للتحقق من الصحة - بيانات التحقق المشترك والتحقق الصريح. في حالة التحقق المتبادل، يستخدم AutoML تكوين الإدخال لإنشاء تقسيمات البيانات إلى طيات التدريب والتحقق من الصحة. يجب الاحتفاظ بترتيب الوقت في هذه التقسيمات، لذلك يستخدم AutoML ما يسمى Rolling Origin Cross Validation الذي يقسم السلسلة إلى بيانات التدريب والتحقق باستخدام نقطة زمنية الأصل. يؤدي تمرير الأصل في الوقت المناسب إلى إنشاء طيات التحقق المقطعي. تحتوي كل طية تحقق من الصحة على الأفق التالي من الملاحظات مباشرة بعد موضع الأصل للطية المحددة. تحافظ هذه الاستراتيجية على تكامل بيانات السلسلة الزمنية وتخفف من مخاطر تسرب المعلومات.

رسم تخطيطي يوضح طيات التحقق من الصحة المتقاطعة التي تفصل مجموعات التدريب والتحقق من الصحة استنادا إلى حجم خطوة التحقق المتبادل.

يتبع AutoML إجراء التحقق المشترك المعتاد، ويدرب نموذجا منفصلا على كل طية ومقاييس التحقق من صحة متوسطها من جميع الطيات.

يتم تكوين التحقق التبادلي لوظائف التنبؤ عن طريق تعيين عدد طيات التحقق المتبادل، واختياريا، عدد الفترات الزمنية بين طيتين متتاليتين للتحقق المتبادل. راجع دليل إعدادات التحقق المشترك المخصص لمزيد من المعلومات ومثال على تكوين التحقق التبادلي للتنبؤ.

يمكنك أيضا إحضار بيانات التحقق من الصحة الخاصة بك. تعرف على المزيد في مقالة تكوين تقسيمات البيانات والتحقق المتبادل في AutoML (SDK v1 ).

الخطوات التالية