יצירת מודלים של סיווג מרובה מחלקה

הושלם

ניתן גם ליצור מודלי סיווג ריבוי, שבהם קיימות יותר משתי כיתות אפשריות. לדוגמה, מרפאת הבריאות עשויה להרחיב את מודל הסכרת כדי לסווג מטופלים באופן הבא:

  • לא חולה סוכרת
  • חולה סוכרת מסוג Type-1
  • סוג 2 של חולה סוכרת

ערכי ההסתברות של המחלקה הבודדת עדיין מסתכמות בסה"כ של 1, כי החולה הוא בוודאות באחת משלוש הכיתות בלבד, והמודל ינבא את המחלקה הסבירה ביותר.

שימוש במודלים של סיווג ברמה מרובה

ניתן לחשוב על סיווג רב-מחלקתי כשילוב של מסווגים בינאריים מרובים. קיימות שתי דרכים שבהן אתה מתקרב לבעיה:

  • One vs Rest (OVR), שבו נוצר מסווג עבור כל ערך מחלקה אפשרי, עם תוצאה חיובית במקרים שבהם החיזוי הוא מחלקה זו, ותחזיות שליליות עבור מקרים שבהם החיזוי הוא כל מחלקה אחרת. לדוגמה, בעיית סיווג עם ארבע סיווגי צורות אפשריים (ריבוע, עיגול, משולש, משושה) תדרוש ארבעה מסווגים שמנבאים:
    • ריבוע או לא
    • עיגול או לא
    • משולש או לא
    • משושה או לא
  • אחד לעומת אחד (OVO), שבו נוצר מסווג עבור כל זוג אפשרי של כיתות. בעיית הסיווג עם ארבע מחלקות צורה תדרוש את הסיווגים הבינאריים הבאים:
    • ריבוע או עיגול
    • ריבוע או משולש
    • ריבוע או משושה
    • עיגול או משולש
    • עיגול או משושה
    • משולש או משושה

בשתי הגישות, המודל הכולל חייב לקחת בחשבון את כל החיזויים הללו כדי לקבוע לאיזה קטגוריה יחידה הפריט שייך.

למרבה המזל, ברוב המסגרות של למידת מכונה, כולל Scikit-Learn, יישום מודל סיווג מרובה מחלקה אינו מורכב באופן משמעותי יותר מסיווג בינארי - ברוב המקרים, האתמכים המשמשים לסווג בינארי תומכים באופן משתמע ב סיווג מרובה על-ידי אבסטרקט אלגוריתם OVR, אלגוריתם OVO או מתן אפשרות לבחירה.