תקציר

הושלם

במודול זה למדנו כיצד הרשתות העצביות המסובבות פועלות, וכיצד הן יכולות ללכוד דפוסים בתמונות דו-ממדיות.

הנה סיכום של המושגים המרכזיים שכיסינו:

  • נתוני תמונה כטנורים: ייצוג תמונות כמערכים רב-ממדיים (H×W לגווני אפור, H×W×3 לצבע), ונירמול ערכי פיקסלים.
  • רשתות עצביות צפופות: בניית רשתות חד-שכבתיות ורב-שכבתיות מחוברות לחלוטין לסיווג תמונה, כולל מושגים כמו softmax, קידוד חד-חם, פונקציות אובדן ואופטימייזרים.
  • התאמת יתר: זיהוי מתי מודל מתאים מדי לנתוני אימון אך לא מgeneral, ואסטרטגיות להתמודדות איתם.
  • רשתות עצביות קונבולוציונליות (CNNs): שימוש במסננים קונבולוציונליים להפקת דפוסים מרחביים, איגוד שכבות להפחתת ממדיות, וארכיטקטורות פירמידה שמשלבות שכבות קונבולוציונליות מרובות.
  • למידת העברה: ניצול מודלים מאומנים מראש כמו VGG-16 כדי להפיק תכונות ולבנות מסווגים למשימות מותאמות אישית עם פחות נתונים וזמן אימון.

למעשה, ניתן להשתמש ב-CNN גם למציאת דפוסים באותות חד-ממדיים (כמו גלי קול, או סדרות זמן), ובמבנים רב-ממדיים (למשל, אירועים בסרטונים שבהם דפוסים מסוימים חוזרים על עצמם בין פריימים שונים). CNNs הן גם אבני הבניין הפשוטות לפתרון משימות מורכבות יותר של ראייה במחשב, כגון 'יצירת תמונה'. רשתות עוינות גנרטיביות (GANs)ומודלים של דיפוזיה (כגון Stable Diffusion ו-DALL· E) משמשים ליצירת תמונות, כאשר מודלים של דיפוזיה מייצגים את מצב האמנות הנוכחי. באופן דומה, CNN משמשים לזיהוי עצמים, חלוקת מופעים ועוד.