ما هو التعلّم الآلي؟

مكتمل

التعلم الآلي له أصوله في الإحصاءات والنمذجة الرياضية للبيانات. الفكرة الأساسية للتعلم الآلي هي استخدام البيانات من الملاحظات السابقة للتنبؤ بنتائج أو قيم غير معروفة. على سبيل المثال:

  • قد يستخدم مالك متجر الآيس كريم تطبيقا يجمع بين المبيعات التاريخية وسجلات الطقس للتنبؤ بعدد الآيس كريمات التي من المحتمل أن يبيعوها في يوم معين، استنادا إلى توقعات الطقس.
  • قد يستخدم الطبيب بيانات سريرية من المرضى السابقين لإجراء اختبارات تلقائية تتنبأ بما إذا كان المريض الجديد معرضا لخطر الإصابة بمرض السكري استنادا إلى عوامل مثل الوزن ومستوى الجلوكوز في الدم وقياسات أخرى.
  • قد يستخدم باحث في القارة القطبية الجنوبية الملاحظات السابقة تلقائيا لتحديد أنواع البطريق المختلفة (مثل Adelie أو Gentoo أو Chinstrap) استنادا إلى قياسات الزعانف والفوترة والسمات المادية الأخرى.

التعلم الآلي كدالة

نظرا لأن التعلم الآلي يستند إلى الرياضيات والإحصاءات، فمن الشائع التفكير في نماذج التعلم الآلي من الناحية الرياضية. بشكل أساسي، نموذج التعلم الآلي هو تطبيق برنامج يغلف دالة لحساب قيمة إخراج استنادا إلى قيمة إدخال واحدة أو أكثر. تعرف عملية تعريف هذه الوظيفة باسم التدريب. بعد تعريف الدالة، يمكنك استخدامها للتنبؤ بقيم جديدة في عملية تسمى الاستدلال.

دعونا نستكشف الخطوات المتضمنة في التدريب والاستدلال.

رسم تخطيطي يوضح مراحل التدريب والاستدلال في التعلم الآلي.

  1. تتكون بيانات التدريب من ملاحظات سابقة. في معظم الحالات، تتضمن الملاحظات السمات المرصودة أو الميزات للشيء الذي يتم ملاحظته، والقيمة المعروفة للشيء الذي تريد تدريب النموذج على التنبؤ به (المعروفة باسم التسمية).

    من الناحية الرياضية، سترى غالبا الميزات المشار إليها باستخدام اسم متغير الاختصار x، والتسمية المشار إليها باسم y. عادة ما تتكون الملاحظة من قيم ميزات متعددة، لذلك x هو في الواقع متجه (صفيف بقيم متعددة)، مثل هذا: [x1,x 2,x 3,...].

    لتوضيح ذلك، دعونا ننظر في الأمثلة الموضحة سابقا:

    • في سيناريو مبيعات الآيس كريم، هدفنا هو تدريب نموذج يمكنه التنبؤ بعدد مبيعات الآيس كريم استنادا إلى الطقس. ستكون قياسات الطقس لليوم (درجة الحرارة وهطول الأمطار والزوال وما إلى ذلك) هي الميزات (x)، وسيكون عدد الآيس كريمات المباعة في كل يوم هو التسمية (y).
    • في السيناريو الطبي، يتمثل الهدف في التنبؤ بما إذا كان المريض معرضا لخطر الإصابة بمرض السكري أم لا بناء على قياساته السريرية. قياسات المريض (الوزن، مستوى الجلوكوز في الدم، وما إلى ذلك) هي الميزات (x)، واحتمال مرض السكري (على سبيل المثال، 1 في حالة الخطر، 0 لعدم التعرض للخطر) هو التسمية (y).
    • في سيناريو البحث في أنتاركتيكا، نريد التنبؤ بأنواع البطريق استنادا إلى سماته المادية. القياسات الرئيسية للبطريق (طول الزعانف، عرض فاتورته، وما إلى ذلك) هي الميزات (x)، والأنواع (على سبيل المثال، 0 ل Adelie، 1 ل Gentoo، أو 2 ل Chinstrap) هي التسمية (y).
  2. يتم تطبيق خوارزمية على البيانات لمحاولة تحديد علاقة بين الميزات والتسمية، وتعميم هذه العلاقة كحساب يمكن إجراؤه على x لحساب y. تعتمد الخوارزمية المحددة المستخدمة على نوع المشكلة التنبؤية التي تحاول حلها (المزيد حول هذا لاحقا)، ولكن المبدأ الأساسي هو محاولة ملاءمة دالة للبيانات، حيث يمكن استخدام قيم الميزات لحساب التسمية.

  3. نتيجة الخوارزمية هي نموذج يغلف الحساب المشتق من الخوارزمية كدالة - دعونا نسميها f. في تدوين رياضي:

    y = f(x)

  4. الآن وبعد اكتمال مرحلة التدريب، يمكن استخدام النموذج المُدرب في الاستنتاج. النموذج هو في الأساس برنامج برمجي يغلف الدالة التي تنتجها عملية التدريب. يمكنك إدخال مجموعة من قيم الميزات، وتلقي تنبؤ بالتسمية المقابلة كإخراج. نظرا لأن الإخراج من النموذج هو تنبؤ تم حسابه بواسطة الدالة، وليس قيمة ملاحظتها، فسترى غالبا الإخراج من الدالة المعروضة على أنها ŷ (التي يتم شفهها بشكل مبهج على أنها "y-hat").