מודלים של למידת מכונה

הושלם

הערה

עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!

מאחר שלמידת מכונה מבוססת על מתמטיקה וסטטיסטיקה, יש לחשוב על מודלים של למידת מכונה במונחים מתמטיים. באופן יסודי, מודל למידת מכונה הוא יישום תוכנה שכורף פונקציה לחישוב ערך פלט בהתבסס על ערך קלט אחד או יותר. תהליך ההגדרה של פונקציה זו ידוע כהדרכה. לאחר הגדרת הפונקציה, באפשרותך להשתמש בה כדי לחזות ערכים חדשים בתהליך שנקרא ' מסקנה'.

בוא נבחן את השלבים המעורבים בהדרכה ובהסתעפות.

דיאגרמה המציגה את שלבי ההדרכה וההסקאות בלמידת מכונה.

  1. נתוני ההדרכה כוללים תצפיות קודמות. ברוב המקרים, התצפיות כוללות את התכונות או התכונות שנצפתו של הדבר שנצפה, ואת הערך הידוע של הדבר שברצונך להכשיר מודל לחיזוי (המכונה התווית).

    במונחים מתמטיים, לעתים קרובות תראה את התכונות הנקראות 'שימוש בשם משתנה קצר x' והתווית שנקראת y. בדרך כלל, תצפית מכילה ערכי תכונות מרובים, ולכן x הוא למעשה וקטור ( מערך עם ערכים מרובים), באופן הבא: [x1,x2,x3,...].

    כדי להפוך זאת לברור יותר, נשקול את הדוגמאות שתוארו קודם לכן:

    • בתרחיש מכירות גלידות, המטרה שלנו היא להכשיר מודל שעשוי לחזות את מספר מכירות הגלידה בהתבסס על מזג האוויר. מדידות מזג האוויר עבור היום (טמפרטורה, כמות משקעים, מהירות רוח וכן הלאה) יהיו התכונות (x), ומספר הגידות שנמכרות בכל יום יהיה התווית (y).
    • בתרחיש הרפואי, המטרה היא לחזות אם מטופל נמצא בסיכון לסכרת בהתבסס על המדידות הקליניות שלהם. מידות החולה (משקל, רמת גלוקוז דם וכן הלאה) הן התכונות (x) ואת הסבירות לסכרת (לדוגמה, 1 לסיכון, 0 על לא בסיכון) היא התווית (y).
    • בתרחיש המחקר האנטארקטי, אנחנו רוצים לחזות את המין של פינגווין בהתבסס על התכונות הפיזיות שלו. מדידות המפתח של הפינגווין (אורך הסנפירים שלו, רוחב החשבון שלו וכן הלאה) הן התכונות (x) והמין (לדוגמה, 0 עבור אדלי, 1 עבור ג'נטו, או 2 עבור Chinstrap) היא התווית (y).
  2. אלגוריתם מוחל על הנתונים כדי לנסות לקבוע קשר גומלין בין התכונות והתווית, ולה generalize קשר גומלין זה בחישוב שניתן לבצע ב- x כדי לחשב y. האלגוריתם הספציפי שבו נעשה שימוש תלוי בסוג הבעיה החזוית שאתה מנסה לפתור (מידע נוסף על כך מאוחר יותר), אך העיקרון הבסיסי הוא לנסות להתאים את הנתונים לפונקציה שבה ניתן להשתמש ערכי התכונות לחישוב התווית.

  3. התוצאה של האלגוריתם היא מודל שכוסף את החישוב הנגזר על-ידי האלגוריתם כפונקציה - בוא נקרא לו f. בספירה מתמטית:

    y = f(x)

  4. כעת, לאחר שלב ההדרכה הושלם, ניתן להשתמש במודל המותאם להסק. המודל הוא למעשה תוכנית תוכנה שכוותקת את הפונקציה המיוצרת על-ידי תהליך ההדרכה. באפשרותך להזין ערכה של ערכי תכונות ולקבל כפלט חיזוי של התווית המתאימה. מאחר שהפלט מהמודל הוא חיזוי שחושב על-ידי הפונקציה, ולא ערך שנצפה, לעתים קרובות תראה את הפלט מהפונקציה המוצגת כ - 0 ( שהיא מילולית למדי כ- y-hat).