مقدمة
في التعلم الآلي ، يتم تدريب النماذج على التنبؤ بنتائج غير معروفة من خلال أنماط التعلم من بيانات التدريب المصنفة. لا تتأثر الطريقة التي يتعلم بها النموذج بالبيانات نفسها فحسب ، بل تتأثر أيضا بالمعلمات الفائقة - الإعدادات التي تتحكم في عملية التدريب. لا يتم تعلمها من البيانات ولكن يتم تعيينها يدويا قبل بدء التدريب ، على سبيل المثال:
- في الانحدار اللوجستي ، يساعد معدل التنظيم على منع الإفراط في التجهيز عن طريق معاقبة النماذج المعقدة للغاية.
- في الشبكات العصبية ، يحدد معدل التعلم مدى سرعة تحديث النموذج لأوزانه ، مما يؤثر على كل من السرعة والدقة.
إشعار
في مصطلحات التعلم الآلي ، تسمى القيم المستفادة من البيانات المعلمات. لتمييزها عن القيم التي تقوم بتكوين عملية التدريب ، نستخدم مصطلح المعلمات الفائقة.
يعد اختيار المعلمات الفائقة الصحيحة أمرا بالغ الأهمية. يمكن أن تؤدي الخيارات السيئة إلى نماذج ضعيفة الأداء أو تفشل في التعميم على البيانات الجديدة. من ناحية أخرى ، يمكن للمعلمات الفائقة المضبوطة جيدا تحسين دقة النموذج وقوته وكفاءته بشكل كبير.
هذا هو المكان الذي يأتي فيه ضبط المعلمات الفائقة - وهي عملية اختبار منهجي لمجموعات مختلفة من قيم المعلمات الفائقة للعثور على أفضل إعداد أداء لبياناتك ومهمتك المحددة.
في Azure Databricks، يمكنك استخدام مكتبة Optuna لأتمتة هذه العملية. يستكشف Optuna بذكاء مساحة المعلمة الفائقة ، ويقوم بتدريب النماذج وتقييمها بشكل متكرر حتى يحدد التكوين الأكثر فعالية. يساعدك هذا في إنشاء نماذج لا تعمل بشكل جيد فحسب ، بل تعمم أيضا بشكل أفضل على البيانات غير المرئية.
في Azure Databricks، يمكنك استخدام مكتبات مثل Optuna أو Ray Tune لتحسين المعلمات الفائقة. في حين أن كلاهما أداتان قويتان ، فإننا نركز في هذه الوحدة على Optuna. يستكشف Optuna بذكاء مساحة المعلمة الفائقة ، ويقوم بتدريب النماذج وتقييمها بشكل متكرر حتى يحدد التكوين الأكثر فعالية. يساعدك هذا في إنشاء نماذج لا تعمل بشكل جيد فحسب ، بل تعمم أيضا بشكل أفضل على البيانات غير المرئية.