نقل التعلم

مكتمل

في الواقع، غالبًا يكون من الأسهل تعلم مهارة جديدة إذا كانت لديك خبرة في مهارة مماثلة وقابلة للنقل. على سبيل المثال، ربما يكون من الأسهل تعليم شخص ما كيفية قيادة الحافلة إذا كان قد تعلم بالفعل كيفية قيادة السيارة. يمكن للسائق البناء على مهارات القيادة التي تعلمها بالفعل في السيارة، وتطبيقها على قيادة الحافلة.

ويمكن تطبيق المبدأ نفسه على تدريب نماذج التعلم العميق من خلال تقنية تسمى نقل التعلم.

كيفية عمل نقل التعلم

تتكون الشبكة العصبية الالتفافية (CNN) لتصنيف الصور عادة من طبقات متعددة تستخرج الميزات، ثم تستخدم طبقة نهائية متصلة بالكامل لتصنيف الصور استنادًا إلى هذه الميزات.

A CNN consisting of a set of feature extraction layers and a fully-connected prediction layer

من الناحية النظرية، تتكون هذه الشبكة العصبية من مجموعتين متميزتين من الطبقات:

  1. مجموعة من الطبقات من النموذج الأساسي التي تنفذ استخراج الميزات.
  2. طبقة متصلة بالكامل تأخذ الميزات المستخرجة وتستخدمها في توقعالفئات.

طبقات استخراج الميزات تطبق عوامل تصفية التفافية وتجميع للتأكيد على الحواف، والزوايا، وأنماط أخرى في الصور التي يمكن استخدامها لتمييزها، ومن الناحية النظرية يجب أن تعمل على أي مجموعة من الصور مع نفس أبعاد طبقة الإدخال بالشبكة. تقوم طبقة التوقع بتعيين الميزات لمجموعة من المخرجات التي تمثل احتمالات لكل تسمية فئة تريد استخدامها لتصنيف الصور.

من خلال فصل الشبكة إلى هذه الأنواع من الطبقات، يمكننا أن نأخذ طبقات استخراج الميزات من نموذج تم تدريبه بالفعل وإلحاق طبقة أو أكثر لاستخدام المعالم المستخرجة للتوقع بتسميات الفئة المناسبة لصورك. يتيح لك هذا الأسلوب الحفاظ على الأوزان المدربة مسبقًا لطبقات استخراج الميزات، ما يعني أنك تحتاج فقط إلى تدريب طبقات التوقع التي قد أضفتها.

هناك العديد من بنيات الشبكة العصبية الالتفافية المنشأة لتصنيف الصور التي يمكنك استخدامها كنموذج أساسي لنقل التعلم، حتى تتمكن من البناء على العمل الذي قام به شخص آخر بالفعل لإنشاء نموذج تصنيف صور فعال بسهولة.