الاستدلال وتقييم نماذج التنبؤ (معاينة)

هام

تُعد هذه الميزة قيد الإصدار الأولي العام في الوقت الحالي. يجري توفير إصدار المعاينة هذا دون اتفاقية على مستوى الخدمة، ولا نوصي باستخدامه لأحمال عمل الإنتاج. قد تكون بعض الميزات غير مدعومة أو قد تكون ذات إمكانيات مقيدة.

لمزيد من المعلومات، راجع ⁧⁩شروط الاستخدام التكميلية لمعاينات Microsoft Azure⁧⁩.

تقدم هذه المقالة المفاهيم المتعلقة بالاستدلال والتقييم النموذجي في مهام التنبؤ. يمكن العثور على إرشادات وأمثلة لنماذج تنبؤ التدريب في AutoML في مقالة التنبؤ بالسلاسل الزمنية لإعداد AutoML .

بمجرد استخدام AutoML لتدريب أفضل نموذج وتحديده، فإن الخطوة التالية هي إنشاء تنبؤات ثم تقييم دقتها في مجموعة اختبار تم إجراؤها من بيانات التدريب، إن أمكن. لمعرفة كيفية إعداد وتشغيل تقييم نموذج التنبؤ في التعلم الآلي التلقائي، راجع دليلنا حول مكونات الاستدلال والتقييم.

سيناريوهات الاستدلال

في التعلم الآلي، الاستدلال هو عملية إنشاء تنبؤات النموذج للبيانات الجديدة غير المستخدمة في التدريب. هناك طرق متعددة لإنشاء تنبؤات في التنبؤ بسبب الاعتماد على الوقت للبيانات. السيناريو الأبسط هو عندما تتبع فترة الاستدلال على الفور فترة التدريب وننشئ تنبؤات لأفق التنبؤ. يوضح هذا السيناريو في الرسم التخطيطي التالي:

رسم تخطيطي يوضح التنبؤ مباشرة بعد فترة التدريب.

يوضح الرسم التخطيطي معلمتين هامتين للاستدلال:

  • طول السياق أو مقدار المحفوظات التي يتطلبها النموذج لإجراء تنبؤ،
  • أفق التنبؤ، وهو مدى التقدم في الوقت الذي يتم فيه تدريب التنبؤ على التنبؤ.

تستخدم نماذج التنبؤ عادة بعض المعلومات التاريخية، السياق، لإجراء تنبؤات مسبقا في الوقت المناسب حتى أفق التنبؤ. عندما يكون السياق جزءا من بيانات التدريب، يحفظ AutoML ما يحتاجه لإجراء التنبؤات، لذلك ليست هناك حاجة لتوفيره بشكل صريح.

هناك سيناريوهان آخران للاستدلال أكثر تعقيدا:

  • إنشاء تنبؤات أبعد في المستقبل من أفق التنبؤ،
  • الحصول على تنبؤات عندما تكون هناك فجوة بين فترات التدريب والاستدلال.

نراجع هذه الحالات في الأقسام الفرعية التالية.

التنبؤ بعد أفق التنبؤ: التنبؤ المتكرر

عندما تحتاج إلى تنبؤات تتجاوز الأفق، يطبق AutoML النموذج بشكل متكرر خلال فترة الاستدلال. وهذا يعني أن التنبؤات من النموذج يتم تغذيتها مرة أخرى كمدخل من أجل إنشاء تنبؤات لنوافذ التنبؤ اللاحقة. يوضح الرسم التخطيطي التالي مثالا بسيطا:

رسم تخطيطي يوضح تنبؤا متكررا على مجموعة اختبار.

هنا، نقوم بإنشاء تنبؤات على فترة ثلاثة أضعاف طول الأفق باستخدام التنبؤات من نافذة واحدة كت سياق للنافذة التالية.

تحذير

يؤدي التنبؤ المتكرر إلى حدوث أخطاء في نمذجة المركبات، لذلك تصبح التنبؤات أقل دقة كلما كانت بعيدة عن أفق التنبؤ الأصلي. قد تجد نموذجا أكثر دقة عن طريق إعادة التدريب مع أفق أطول في هذه الحالة.

التنبؤ مع وجود فجوة بين فترات التدريب والاستدلال

لنفترض أنك قمت بتدريب نموذج في الماضي وتريد استخدامه لإجراء تنبؤات من الملاحظات الجديدة التي لم تكن متاحة بعد أثناء التدريب. في هذه الحالة، هناك فجوة زمنية بين فترات التدريب والاستدلال:

رسم تخطيطي يوضح التنبؤ مع وجود فجوة بين فترات التدريب والاستدلال.

يدعم AutoML سيناريو الاستدلال هذا، ولكنك تحتاج إلى توفير بيانات السياق في فترة الفجوة، كما هو موضح في الرسم التخطيطي. تحتاج بيانات التنبؤ التي تم تمريرها إلى مكون الاستدلال إلى قيم للميزات والقيم المستهدفة المرصودة في الفجوة والقيم المفقودة أو قيم "NaN" للهدف في فترة الاستدلال. يعرض الجدول التالي مثالا على هذا النمط:

جدول يعرض مثالا لبيانات التنبؤ عندما تكون هناك فجوة بين فترات التدريب والاستدلال.

هنا، يتم توفير القيم المعروفة للهدف والميزات 2023-05-01 حتى 2023-05-03. تشير القيم المستهدفة المفقودة بدءا من 2023-05-04 إلى أن فترة الاستدلال تبدأ في ذلك التاريخ.

يستخدم AutoML بيانات السياق الجديدة لتحديث التأخر وميزات البحث الأخرى، وأيضا لتحديث نماذج مثل ARIMA التي تحافظ على حالة داخلية. لا تقوم هذه العملية بتحديث معلمات النموذج أو إعادة احتواءها.

تقييم النموذج

التقييم هو عملية إنشاء تنبؤات على مجموعة اختبار محتفظ بها من بيانات التدريب ومقاييس الحوسبة من هذه التنبؤات التي توجه قرارات توزيع النموذج. وفقا لذلك، هناك وضع استدلال مناسب خصيصا لتقييم النموذج - تنبؤ متجدد. نراجعه في القسم الفرعي التالي.

التنبؤ المتداول

يتمثل إجراء أفضل الممارسات لتقييم نموذج التنبؤ في إعادة توجيه المتنبأ المدرب إلى الأمام في الوقت المناسب عبر مجموعة الاختبار، متوسط مقاييس الخطأ عبر عدة نوافذ تنبؤ. يسمى هذا الإجراء أحيانا backtest، اعتمادا على السياق. من الناحية المثالية، تكون مجموعة الاختبار للتقييم طويلة بالنسبة لأفق التنبؤ بالنموذج. قد تكون تقديرات خطأ التنبؤ مزعجة إحصائيا وبالتالي أقل موثوقية.

يوضح الرسم التخطيطي التالي مثالا بسيطا مع ثلاث نوافذ تنبؤ:

رسم تخطيطي يوضح تنبؤا متجددا على مجموعة اختبار.

يوضح الرسم التخطيطي ثلاث معلمات تقييم متجددة:

  • طول السياق أو مقدار المحفوظات التي يتطلبها النموذج لإجراء تنبؤ،
  • أفق التنبؤ، وهو مدى التقدم في الوقت الذي يتم فيه تدريب التنبؤ على التنبؤ،
  • حجم الخطوة، وهو مدى التقدم في الوقت الذي تتقدم فيه النافذة المتداولة على كل تكرار في مجموعة الاختبار.

والأهم من ذلك، يتقدم السياق جنبا إلى جنب مع نافذة التنبؤ. وهذا يعني أنه يتم استخدام القيم الفعلية من مجموعة الاختبار لإجراء تنبؤات عندما تقع ضمن نافذة السياق الحالية. يسمى آخر تاريخ للقيم الفعلية المستخدمة لنافذة تنبؤ معينة وقت أصل النافذة. يعرض الجدول التالي مثالا على الإخراج من التنبؤ المتداول المكون من ثلاث نوافذ مع أفق من ثلاثة أيام وحجم خطوة ليوم واحد:

مثال على جدول الإخراج من التنبؤ المتداول.

باستخدام جدول مثل هذا، يمكننا تصور التنبؤات مقابل الفعلية وحساب مقاييس التقييم المطلوبة. يمكن أن تنشئ مسارات AutoML تنبؤات متجددة على مجموعة اختبار مع مكون الاستدلال.

ملاحظة

عندما تكون فترة الاختبار هي نفس طول أفق التنبؤ، فإن التنبؤ المتداول يعطي نافذة واحدة من التنبؤات حتى الأفق.

مقاييس التقييم

عادة ما يكون اختيار ملخص التقييم أو المقياس مدفوعا بسيناريو العمل المحدد. تتضمن بعض الخيارات الشائعة ما يلي:

  • مخططات القيم المستهدفة المرصودة مقابل القيم المتوقعة للتحقق من أن بعض ديناميكيات البيانات يتم التقاطها بواسطة النموذج،
  • MAPE (متوسط خطأ النسبة المئوية المطلقة) بين القيم الفعلية والقيم المتوقعة،
  • RMSE (خطأ تربيعي متوسط الجذر)، ربما مع التسوية، بين القيم الفعلية والمتوقعة،
  • MAE (متوسط الخطأ المطلق)، ربما مع التسوية، بين القيم الفعلية والمتوقعة.

هناك العديد من الاحتمالات الأخرى، اعتمادا على سيناريو العمل. قد تحتاج إلى إنشاء أدوات مساعدة ما بعد المعالجة الخاصة بك لمقاييس تقييم الحوسبة من نتائج الاستدلال أو التنبؤات المتداولة. لمزيد من المعلومات حول المقاييس، راجع قسم مقالة مقاييس الانحدار والتنبؤ .

الخطوات التالية