स्थानांतरण सीखना
जीवन में, एक नया कौशल सीखना अक्सर आसान होता है यदि आपके पास पहले से ही एक समान, हस्तांतरणीय कौशल में विशेषज्ञता है। उदाहरण के लिए, किसी को बस चलाना सिखाना शायद आसान है यदि वे पहले से ही कार चलाना सीख चुके हैं। ड्राइवर ड्राइविंग कौशल पर निर्माण कर सकता है जो उन्होंने पहले से ही एक कार में सीखा है, और उन्हें बस चलाने के लिए लागू कर सकता है।
इसी सिद्धांत को ट्रांसफर लर्निंगनामक तकनीक के माध्यम से गहन शिक्षण मॉडल के प्रशिक्षण के लिए लागू किया जा सकता है।
ट्रांसफर लर्निंग कैसे काम करती है
छवि वर्गीकरण के लिए एक दृढ़ तंत्रिका नेटवर्क (सीएनएन) आमतौर पर कई परतों से बना होता है जो सुविधाओं को निकालते हैं, और फिर इन विशेषताओं के आधार पर छवियों को वर्गीकृत करने के लिए अंतिम पूरी तरह से जुड़ी परत का उपयोग करते हैं।
वैचारिक रूप से, इस तंत्रिका नेटवर्क में परतों के दो अलग-अलग सेट होते हैं:
- आधार मॉडल से परतों का एक सेट जो प्रदर्शन करता हैनिष्कर्षण की सुविधा देता है।
- एक पूरी तरह से जुड़ी परत जो निकाली गई सुविधाओं को लेती है और उन्हें कक्षा भविष्यवाणीके लिए उपयोग करती है।
सुविधा निष्कर्षण परतें छवियों में किनारों, कोनों और अन्य पैटर्न पर जोर देने के लिए दृढ़ फिल्टर और पूलिंग लागू करती हैं, जिनका उपयोग उन्हें अलग करने के लिए किया जा सकता है, और सिद्धांत रूप में नेटवर्क की इनपुट परत के समान आयामों वाली छवियों के किसी भी सेट के लिए काम करना चाहिए। भविष्यवाणी परत सुविधाओं को आउटपुट के एक सेट में मैप करती है जो प्रत्येक वर्ग लेबल के लिए संभावनाओं का प्रतिनिधित्व करती है जिसे आप छवियों को वर्गीकृत करने के लिए उपयोग करना चाहते हैं।
नेटवर्क को इस प्रकार की परतों में अलग करके, हम एक मॉडल से फीचर निष्कर्षण परतें ले सकते हैं जो पहले से ही प्रशिक्षित हो चुके हैं और आपकी छवियों के लिए उपयुक्त वर्ग लेबल की भविष्यवाणी के लिए निकाली गई सुविधाओं का उपयोग करने के लिए एक या अधिक परतों को जोड़ सकते हैं। यह दृष्टिकोण आपको सुविधा निष्कर्षण परतों के लिए पूर्व-प्रशिक्षित भार रखने में सक्षम बनाता है, जिसका अर्थ है कि आपको केवल आपके द्वारा जोड़ी गई भविष्यवाणी परतों को प्रशिक्षित करने की आवश्यकता है।
छवि वर्गीकरण के लिए कई स्थापित दृढ़ तंत्रिका नेटवर्क आर्किटेक्चर हैं जिन्हें आप स्थानांतरण सीखने के लिए आधार मॉडल के रूप में उपयोग कर सकते हैं, ताकि आप उस काम पर निर्माण कर सकें जो किसी और ने पहले से ही एक प्रभावी छवि वर्गीकरण मॉडल बनाने के लिए किया है।