فهم مبادئ التعلم الآلي
التعلم الآلي هو تقنية برمجة تستخدم لإنشاء نماذج تنبؤية. على عكس البرمجة النموذجية، التي تستخدم فيها التعليمات البرمجية لوصف خطوات محددة لتحقيق نتيجة؛ يعتمد التعلم الآلي على استخدام خوارزمية لاستكشاف العلاقة بين ميزات كيان البيانات والتسمية التي يجب أن يتوقعها النموذج الناتج بشكل متكرر. تستند خوارزميات التعلم الآلي إلى نظرية الاحتمال والإحصاءات، وتعتمد على كميات كبيرة من البيانات لتدريب النموذج.
على مستوى تبسيطي، نموذج التعلم الآلي هو دالة تأخذ ميزات كيان ملاحظ (خصائصه) وتنفذ عملية حسابية عليها لإرجاع تسمية متوقعة. من الشائع الإشارة بشكل عام إلى الميزات ك x والتسمية المتوقعة ك y؛ لذلك في الواقع، نموذج التعلم الآلي هو الدالة f في التعبير y = f(x).
يتم تحديد العملية المحددة التي تنفذها الدالة على الميزات من أجل حساب قيمة للتسمية بواسطة الخوارزمية المستخدمة لتدريب النموذج.
أنواع التعلم الآلي
على نطاق واسع، هناك نوعان شائعان من التعلم الآلي:
- التعلم الآلي الخاضع للإشراف حيث يتم تدريب النموذج باستخدام البيانات التي تتضمن قيم تسمية معروفة (لذلك تستخدم الخوارزمية البيانات الموجودة لإنشاء علاقة بين xوy، ما يؤدي إلى دالة يمكن تطبيقها على x لحساب y).
- التعلم الآلي غير الخاضع للإشراف حيث يتم تدريب النموذج باستخدام قيم الميزة (x) فقط، وملاحظات المجموعات (أو المجموعات) ذات الميزات المماثلة.
التعلّم الآلي الخاضع للإشراف
تركز هذه الوحدة على التعلم الآلي الخاضع للإشراف لأن هذا هو السيناريو الأكثر شيوعا. ضمن التعريف الواسع للتعلم الآلي الخاضع للإشراف، هناك نوعان شائعان من خوارزمية التعلم الآلي:
خوارزميات الانحدار التي تكون فيها التسمية قيمة رقمية، مثل السعر أو درجة الحرارة أو المقدار أو أي قيمة أخرى يمكن قياسها. تنتج خوارزميات الانحدار نماذج تعمل فيها الدالة (f) على الميزات (x) لحساب القيمة الرقمية للتسمية (y).
على سبيل المثال، يمكن استخدام خوارزمية الانحدار لتدريب نموذج يتنبأ بالعدد المتوقع من الآيس كريمات التي يباعها كشك في حديقة في يوم معين استنادا إلى ميزات مثل شهر السنة ويوم الأسبوع ودرجة الحرارة والرطوبة وما إلى ذلك.
خوارزميات التصنيف التي تكون فيها التسمية فئة منفصلة (أو فئة). تنتج خوارزميات التصنيف نماذج تعمل فيها الدالة (f) على الميزات (x) لحساب قيمة الاحتمال لكل فئة ممكنة، وترجع التسمية (y) للفئة ذات الاحتمال الأعلى.
على سبيل المثال، يمكن استخدام خوارزمية التصنيف لتدريب نموذج يتنبأ بما إذا كان المريض مصابا بمرض السكري أم لا استنادا إلى ميزات مثل مستوى أنسولين الدم والوزن والطول والعمر وما إلى ذلك. نموذج التصنيف الذي يحدد إحدى فئتين محتملتين (مثل صواب أو خطأ) هو مثال على التصنيف الثنائي . تستخدم الخوارزميات التي تتنبأ باحتمال أكثر من فئتين (على سبيل المثال، التمييز بين المرضى الذين لا يعانون من مرض السكري أو السكري من النوع 1 أو النوع 2) للتصنيف متعدد الطبقات .
التعلّم الآلي غير الخاضع للإشراف
الشكل الأكثر شيوعا للتعلم غير الخاضع للإشراف هو التجميع، حيث تعتبر ميزات حالات البيانات كمتجه للنقاط في مساحة متعددة الأبعاد. الهدف من خوارزمية التجميع هو تحديد المجموعات التي تجمع النقاط بحيث تكون الحالات ذات الميزات المماثلة قريبة معا، ولكن من الواضح أن المجموعات منفصلة عن بعضها البعض.
يعد التجميع مفيدا عندما تحتاج إلى تحديد فئات مختلفة من البيانات ولكن ليس لديك فئات محددة مسبقا تم تعيين ملاحظات البيانات الموجودة إليها بالفعل. على سبيل المثال، قد ترغب في تقسيم العملاء استنادا إلى أوجه التشابه في ملفات التعريف الخاصة بهم. يمكن أيضا استخدام التجميع كخطوة أولية في إنشاء حل تصنيف - بشكل أساسي، يمكنك استخدام التجميع لتحديد الفئات المناسبة لبياناتك.