ضبط نموذج المعلمات الفائقة

مقالة
06/01/2023

توضح هذه المقالة كيفية استخدام مكون Tune Model Hyperparameters في مصمم التعلم الآلي من Microsoft Azure. الهدف هو تحديد المعلمات الفائقة المثلى لنموذج التعلم الآلي. يبني المكون ويختبر نماذج متعددة باستخدام مجموعات مختلفة من الإعدادات. يقارن المقاييس عبر جميع النماذج للحصول على مجموعات الإعدادات.

يمكن أن تكون المصطلحات معلمة ومعلمة تشعبية محيرة. معلمات النموذج هي ما تقوم بتعيينه في الجزء الأيمن من المكون. بشكل أساسي، يقوم هذا المكون بإجراء عملية مسح للمعامل على إعدادات المعامل المحددة. فهو يتعرف على المجموعة المثلى من المعلمات الفائقة، والتي قد تكون مختلفة لكل شجرة قرار أو مجموعة بيانات أو طريقة انحدار محددة. تسمى عملية العثور على التكوين الأمثل أحيانًا التوليف.

يدعم المكون الطريقة التالية للعثور على الإعدادات المثلى لنموذج: تدريب وضبط متكامل. في هذه الطريقة، تقوم بتكوين مجموعة من المعلمات لاستخدامها. يمكنك بعد ذلك السماح للمكون بالتكرار عبر مجموعات متعددة. يقيس المكون الدقة حتى يعثر على نموذج "أفضل". مع معظم مكونات المتعلم، يمكنك اختيار المعلمات التي يجب تغييرها أثناء عملية التدريب وأيها يجب أن يظل ثابتًا.

اعتمادًا على المدة التي تريد تشغيل عملية الضبط فيها، قد تقرر اختبار جميع التوليفات بشكل شامل. أو يمكنك تقصير العملية عن طريق إنشاء شبكة من مجموعات المعلمات واختبار مجموعة فرعية عشوائية من شبكة المعلمات.

تنشئ هذه الطريقة نموذجًا مدربًا يمكنك حفظه لإعادة استخدامه.

تلميح

يمكنك القيام بمهمة ذات صلة. قبل أن تبدأ الضبط، قم بتطبيق تحديد المعالم لتحديد الأعمدة أو المتغيرات التي لها أعلى قيمة معلومات.

كيفية تكوين ضبط نموذج المعلمات الفائقة

يتطلب تعلم المعلمات الفائقة المثلى لنموذج التعلم الآلي استخدامًا كبيرًا للتدفقات.

قم بتدريب نموذج باستخدام عملية مسح المعلمات

يصف هذا القسم كيفية إجراء عملية مسح للمعلمات الأساسية، والتي تدرب نموذجًا باستخدام مكون Tune Model Hyperparameters.

أضف مكون Tune Model Hyperparameters إلى التدفقات الخاصة بك في المصمم.
قم بتوصيل نموذج غير مدرب بمدخل أقصى اليسار.

ملاحظة

لا يمكن توصيل المعلمات التشعبية للنموذج الضبط إلا بمكونات خوارزمية التعلم الآلي المضمنة، ولا يمكنها دعم النموذج المخصص المضمن في إنشاء نموذج Python.
أضف مجموعة البيانات التي تريد استخدامها للتدريب، وقم بتوصيلها بالمدخل الأوسط من Tune Model Hyperparameters.

اختياريًا، إذا كانت لديك مجموعة بيانات مميزة بعلامات، فيمكنك توصيلها بمنفذ الإدخال الموجود في أقصى اليمين (مجموعة بيانات التحقق الاختيارية). يتيح لك هذا قياس الدقة أثناء التدريب والضبط.
في اللوحة اليمنى من Tune Model Hyperparameters، اختر قيمة لـ وضع مسح المعلمات . يتحكم هذا الخيار في كيفية تحديد المعلمات.
- شبكة كاملة: عند تحديد هذا الخيار، يتم تكرار حلقات المكون عبر شبكة محددة مسبقًا بواسطة النظام، لتجربة مجموعات مختلفة وتحديد أفضل متعلم. يكون هذا الخيار مفيدًا عندما لا تعرف ما هي أفضل إعدادات المعلمات وترغب في تجربة كل مجموعات القيم الممكنة.
- المسح العشوائي: عند تحديد هذا الخيار، سيقوم المكون بتحديد قيم المعلمات بشكل عشوائي عبر نطاق محدد بواسطة النظام. يجب تحديد الحد الأقصى لعدد عمليات التشغيل التي تريد أن يقوم المكون بتنفيذها. يكون هذا الخيار مفيدًا عندما تريد زيادة أداء النموذج باستخدام المقاييس التي تختارها مع الحفاظ على موارد الحوسبة.
بالنسبة إلى عمود التسمية، افتح محدد العمود لاختيار عمود تسمية واحد.
اختر عدد الأشواط:
- الحد الأقصى لعدد مرات التشغيل في عملية المسح العشوائي: إذا اخترت عملية مسح عشوائية، فيمكنك تحديد عدد مرات تدريب النموذج، باستخدام مجموعة عشوائية من قيم المعلمات.
بالنسبة إلى الترتيب، اختر مقياسًا واحدًا لاستخدامه في ترتيب النماذج.

عند تشغيل عملية مسح للمعلمات، يحسب المكون جميع المقاييس القابلة للتطبيق لنوع النموذج ويعيدها في تقرير نتائج المسح. يستخدم المكون مقاييس منفصلة لنماذج الانحدار والتصنيف.

ومع ذلك، فإن المقياس الذي تختاره يحدد كيفية ترتيب النماذج. يتم إخراج النموذج الأعلى فقط، وفقًا لتصنيف المقياس المختار، كنموذج مدرب لاستخدامه في تسجيل النقاط.
بالنسبة إلى البداية العشوائية، أدخل عددًا صحيحًا كحالة زائفة لمولد الأرقام العشوائية المستخدمة للاختيار العشوائي لقيم المعلمات عبر نطاق محدد مسبقًا. تكون هذه المعلمة فعالة فقط إذا كان وضع مسح المعلمات هو مسح عشوائي.
إرسال المسار.

نتائج ضبط الفائق

عند اكتمال التدريب:

لعرض نتائج المسح، يمكنك إما النقر بزر الماوس الأيمن فوق المكون، ثم تحديد تصور، أو النقر بزر الماوس الأيمن فوق منفذ الإخراج الأيسر للمكون لتصوره.

تتضمن نتائج المسح جميع عمليات مسح المعلمات ومقاييس الدقة التي تنطبق على نوع النموذج، ويحدد المقياس الذي حددته للترتيب النموذج الذي يعتبر "الأفضل".
لحفظ لقطة من النموذج المدرب، حدد علامة التبويب المخرجات + السجلات في اللوحة اليمنى لمكون نموذج التدريب. حدد أيقونة تسجيل مجموعة البيانات لحفظ النموذج كمكوِّن قابل لإعادة الاستخدام.

ملاحظات فنية

يحتوي هذا القسم على تفاصيل التنفيذ والنصائح.

كيف يعمل مسح المعلمة

عندما تقوم بإعداد مسح للمعامل، فإنك تحدد نطاق البحث الخاص بك. قد يستخدم البحث عددًا محدودًا من المعلمات المختارة عشوائيًا. أو قد يكون بحثًا شاملاً في مساحة المعلمة التي تحددها.

المسح العشوائي: يقوم هذا الخيار بتدريب النموذج باستخدام عدد محدد من التكرارات.

أنت تحدد نطاقًا من القيم للتكرار، ويستخدم المكون مجموعة فرعية مختارة عشوائيًا من هذه القيم. يتم اختيار القيم مع الاستبدال، مما يعني أن الأرقام المختارة مسبقًا عشوائيًا لا تتم إزالتها من مجموعة الأرقام المتاحة. لذا فإن فرصة اختيار أي قيمة تظل كما هي عبر جميع التمريرات.
الشبكة بالكامل: يعني خيار استخدام الشبكة بالكامل أنه تم اختبار كل مجموعة. هذا الخيار هو الأكثر شمولاً، لكنه يتطلب معظم الوقت.

التحكم في طول وتعقيد التدريب

يمكن أن يستغرق التكرار عبر العديد من مجموعات الإعدادات وقتًا طويلاً، لذلك يوفر المكون عدة طرق لتقييد العملية:

حدد عدد التكرارات المستخدمة لاختبار نموذج.
حدد مساحة المعلمة.
حدد كل من عدد التكرارات ومساحة المعلمة.

نوصي بتدوين الإعدادات لتحديد الطريقة الأكثر فاعلية للتدريب على مجموعة بيانات ونموذج معينين.

اختيار مقياس التقييم

في نهاية الاختبار، يقدم النموذج تقريرًا يحتوي على دقة كل نموذج حتى تتمكن من مراجعة نتائج القياس:

يتم استخدام مجموعة موحدة من المقاييس لجميع نماذج التصنيف الثنائي.
يتم استخدام الدقة لجميع نماذج التصنيف متعددة الفئات.
يتم استخدام مجموعة مختلفة من المقاييس لنماذج الانحدار.

ومع ذلك، أثناء التدريب، يجب عليك اختيار مقياس فردي لاستخدامه في ترتيب النماذج التي تم إنشاؤها أثناء عملية الضبط. قد تجد أن أفضل مقياس يختلف، اعتمادًا على مشكلة عملك وتكلفة الإيجابيات الكاذبة والسلبيات الكاذبة.

المقاييس المستخدمة في التصنيف الثنائي

الدقة هي نسبة النتائج الحقيقية إلى إجمالي الحالات.
الإحكام هو نسبة النتائج الحقيقية إلى النتائج الإيجابية.
الاستدعاء هو جزء من جميع النتائج الصحيحة في جميع النتائج.
درجة F هي مقياس يوازن بين الدقة والتذكر.
AUC هي القيمة التي تمثل المنطقة الواقعة أسفل المنحنى عندما يتم رسم الإيجابيات الزائفة على المحور x والإيجابيات الحقيقية على المحور y.
متوسط خسارة السجل هو الفرق بين توزيعين احتماليين: التوزيع الحقيقي والتوزيع في النموذج.

المقاييس المستخدمة للانحدار

يحسب متوسط الخطأ المطلق متوسط جميع الأخطاء في النموذج، حيث يعني الخطأ مسافة القيمة المتوقعة من القيمة الحقيقية. غالبًا ما يتم اختصارها كـ MAE.
جذر متوسط الخطأ التربيعي يقيس متوسط مربعات الأخطاء، ثم يأخذ جذر تلك القيمة. غالبًا ما يتم اختصارها كـ RMSE.
الخطأ المطلق النسبي يمثل الخطأ كنسبة مئوية من القيمة الحقيقية.
الخطأ التربيعي النسبي يعمل على تسوية الخطأ التربيعي الإجمالي بالقسمة على إجمالي الخطأ التربيعي للقيم المتوقعة.
معامل التحديد هو رقم واحد يشير إلى مدى ملاءمة البيانات للنموذج. تعني القيمة "واحد" أن النموذج يطابق البيانات تمامًا. تعني القيمة الصفرية أن البيانات عشوائية أو لا يمكن أن تتناسب مع النموذج. غالبًا ما يطلق عليه r² أو R² أو r-squared.

المكونات التي لا تدعم مسح المعلمات

يدعم جميع المتعلمين في التعلم الآلي من Azure تقريبًا التحقق المتبادل من خلال عملية مسح للمعلمات المتكاملة، مما يتيح لك اختيار المعلمات للتوجيه باستخدامها. إذا كان المتعلم لا يدعم تعيين مجموعة من القيم، فلا يزال بإمكانك استخدامها في التحقق المتبادل. في هذه الحالة، يتم تحديد نطاق من القيم المسموح بها لعملية المسح.

الخطوات التالية

راجع مجموعة المكونات المتوفرة للتعلم الآلي من Azure.

مشاركة عبر