تحديد المشكلة
بدءا من الخطوة الأولى، تريد تحديد المشكلة التي يجب أن يحلها النموذج، من خلال فهم:
- ما يجب أن يكون عليه إخراج النموذج.
- ما نوع مهمة التعلم الآلي التي تستخدمها.
- ما هي المعايير التي تجعل النموذج ناجحا.
اعتمادا على البيانات التي لديك والإخراج المتوقع للنموذج، يمكنك تحديد مهمة التعلم الآلي. تحدد المهمة أنواع الخوارزميات التي يمكنك استخدامها لتدريب النموذج.
بعض مهام التعلم الآلي الشائعة هي:
- التصنيف: توقع قيمة فئوية.
- الانحدار: توقع قيمة رقمية.
- التنبؤ بالسلاسل الزمنية: توقع القيم الرقمية المستقبلية استنادا إلى بيانات السلاسل الزمنية.
- رؤية الكمبيوتر: تصنيف الصور أو الكشف عن العناصر في الصور.
- معالجة اللغة الطبيعية (NLP): استخراج الرؤى من النص.
لتدريب نموذج، لديك مجموعة من الخوارزميات التي يمكنك استخدامها، اعتمادا على المهمة التي تريد تنفيذها. لتقييم النموذج، يمكنك حساب مقاييس الأداء مثل الدقة أو الدقة. تعتمد المقاييس المتوفرة أيضا على المهمة التي يحتاج النموذج إلى تنفيذها وتساعدك على تحديد ما إذا كان النموذج ناجحا في مهمته.
استكشاف مثال
ضع في اعتبارك سيناريو حيث تريد تحديد ما إذا كان المرضى مصابين بمرض السكري. تحدد المشكلة التي تحاول حلها ونوع البيانات المتوفرة مهمة التعلم الآلي التي تختارها. في هذه الحالة، البيانات المتاحة هي نقاط بيانات صحية أخرى من المرضى. يمكننا تمثيل الإخراج الذي نريده كمعلومات قاطعة إما أن المريض مصاب بداء السكري أو ليس لديه مرض السكري. وبالتالي، فإن مهمة التعلم الآلي هي التصنيف.
يمنحك فهم العملية بأكملها قبل البدء فرصة لتعيين القرارات التي تحتاج إلى اتخاذها لتصميم حل تعلم آلي ناجح. فيما يلي رسم تخطيطي يوضح طريقة واحدة لمعالجة مشكلة تحديد مرض السكري في المريض. في الرسم التخطيطي، يتم إعداد البيانات وتقسيمها وتدريبها باستخدام خوارزميات معينة. بعد ذلك، يتم تقييم النموذج للجودة.
- تحميل البيانات: استيراد مجموعة البيانات وفحصها.
- بيانات المعالجة المسبقة: التطبيع والتنظيف للتناسق.
- تقسيم البيانات: منفصلة إلى مجموعات التدريب والاختبار.
- اختيار نموذج: حدد خوارزمية وقم بتكوينها.
- نموذج التدريب: تعرف على أنماط من بيانات التدريب.
- نموذج النتيجة: إنشاء تنبؤات على بيانات الاختبار.
- تقييم: حساب مقاييس الأداء.
غالبا ما يكون تدريب نموذج التعلم الآلي عملية تكرارية، حيث تمر بكل خطوة من هذه الخطوات عدة مرات للعثور على النموذج الأفضل أداء. بعد ذلك، دعونا نفحص عملية إعداد البيانات لتطوير حل التعلم الآلي.