הבנת מושגי למידה עמוקה
במוח שלך, יש לך תאי עצבים שנקראים נוירונים, המחוברים זה לזה על ידי מרוחה עצבית שעוברת אותות אלקטרוכימיים דרך הרשת.
כאשר הנוירון הראשון ברשת מגורה, אות הקלט מעובד, ואם הוא חורג מסף מסוים, הנוירון מופעל ומעביר את האות אל הנוירונים שאליהם הוא מחובר. הנוירונים האלה עשויים להיות מופעלים ולה להעביר את האות דרך שאר הרשת. עם הזמן, הקשרים בין הנוירונים מתחזקים על ידי שימוש תכוף כפי שאתה לומד כיצד להגיב ביעילות. לדוגמה, אם אתה מוצג תמונה של פינגווין, חיבורי הנוירונים שלך מאפשרים לך לעבד את המידע בתמונה ואת הידע שלך על המאפיינים של פינגווין כדי לזהות אותו כך. לאורך זמן, אם אתה מוצג תמונות מרובות של בעלי חיים שונים, רשת הנוירונים המעורבים בזיהוי בעלי חיים בהתבסס על המאפיין שלהם לגדול חזק יותר. במילים אחרות, אתה מקבל טוב יותר בזיהוי מדויק של בעלי חיים שונים.
למידה עמוקה מדמה תהליך ביולוגי זה באמצעות רשתות עצביות מלאכותיות שמעבדות קלט מספרי במקום גירויים אלקטרוכימיים.
חיבורי העצבים הנכנסים מוחלפים בקלט מספרי המזוהה בדרך כלל כ- x. כאשר קיים יותר מערך קלט אחד, x נחשב לווקטור עם רכיבים בשם x1, x2 וכן הלאה.
המשויך לכל ערך xהוא משקל (w), המשמש לחיזוק או להחליש את האפקט של ערך x כדי לדמות למידה. בנוסף, נוסף קלט הטיה (ב) כדי לאפשר בקרה גרגרית ברשת. במהלך תהליך ההדרכה, ערכי w ו- b מותאמים לכוונון הרשת כך שהיא "לומדת" כדי להפיק פלטים נכונים.
הנוירון עצמו כובס פונקציה המחשבת סכום מסולסל של x, w ו- b. פונקציה זו מוקפת בפונקציית הפעלה של המגבילה את התוצאה (לעתים קרובות לערך בין 0 ל- 1) כדי לקבוע אם הנוירון מעביר פלט בשכבה הבאה של נוירונים ברשת.
הכשרת מודל למידה עמוקה
מודלים של למידה עמוקה הם רשתות עצביות המורכבות משכבות מרובות של נוירונים מלאכותיים. כל שכבה מייצגת ערכה של פונקציות המבוצעות על ערכי x עם משקלי w והטיות משויכים, והתוצאה של השכבה הסופית היא פלט של תווית y שהמודל מנבא. במקרה של מודל סיווג (המנבא את הקטגוריה או המחלקה העדכניים ביותר עבור נתוני הקלט), הפלט הוא וקטור המכיל את ההסתברות לכל מחלקה אפשרית.
הדיאגרמה הבאה מייצגת מודל למידה עמוק שמנבא את המחלקה של ישות נתונים בהתבסס על ארבע תכונות (ערכי x ). הפלט של המודל (ערכי y ) הוא ההסתברות לכל אחת משלוש תוויות מחלקה אפשריות.
כדי לתרגל את המודל, מסגרת למידה עמוקה מזנת אצוות מרובות של נתוני קלט (שעבורן ידועים ערכי התוויות בפועל), מחילה את הפונקציות בכל שכבות הרשת ומודדת את ההפרש בין הסתברות הפלט לבין תוויות המחלקה הידועות בפועל של נתוני ההדרכה. ההבדל המצטבר בין פלט החיזוי לבין התוויות בפועל ידוע כנוצר.
לאחר שחושב האובדן המצטבר עבור כל אצוות הנתונים, מסגרת הלמידה העמוקה משתמשת במטב כדי לקבוע כיצד יש להתאים את המשקלים וההטיות במודל כדי להפחית את האובדן הכולל. התאמות אלה מוחלות לאחור בשכבות במודל הרשת העצבית, ולאחר מכן הנתונים מועברים שוב דרך הרשת וההפסד מחושב מחדש. תהליך זה חוזר מספר פעמים (כל איטרציה נקראת epoch) עד שההפסד ממוזער והמודל "למד" את המשקל וההטיה המתאימים כדי שניתן יהיה לחזות במדויק.
במהלך כל תקופות, המשקל וההטיה מותאמים כדי למזער את האובדן. הכמות שבה הם מותאמים כפופה לתעריף הלמידה שאתה מציין למטב. אם שיעור הלמידה נמוך מדי, תהליך ההדרכה עשוי להימשך זמן רב כדי לקבוע ערכים מיטביים; אך אם היא גבוהה מדי, ייתכן שהאופטימיזציה לעולם לא תמצא את הערכים האופטימליים.