Erstellen von Multiklassen-Klassifizierungsmodellen

Abgeschlossen

Es ist auch möglich, mehrklassige Klassifizierungsmodelle zu erstellen, in denen es mehr als zwei mögliche Klassen gibt. Beispielsweise könnte das Klinikum das Diabetesmodell erweitern, um Patienten wie folgt zu klassifizieren:

  • Nicht-Diabetiker
  • Typ-1-Diabetiker
  • Typ-2-Diabetiker

Die einzelnen Klassenwahrscheinlichkeitswerte würden immer noch eine Summe von 1 ergeben (der Patient ist definitiv in einer der drei Klassen), und die wahrscheinlichste Klasse würde vom Modell vorhergesagt werden.

Verwenden von Multiklassen-Klassifizierungsmodellen

Multiklassen-Klassifizierung kann als Kombination aus mehreren binären Klassifizierern bezeichnet werden. Es gibt zwei Möglichkeiten, das Problem anzugehen:

  • One-vs-Rest (OVR): Hierbei wird ein Klassifizierer für jeden möglichen Klassenwert erstellt, und zwar mit einem positiven Ergebnis für Fälle, in denen die Vorhersage dieser Klasse entspricht, und negativen Vorhersagen für Fälle, in denen die Vorhersage einer anderen Klasse entspricht. Beispielsweise würde ein Klassifizierungsproblem mit vier möglichen Formklassen (Quadrat, Kreis, Dreieck, Sechseck) vier Klassifizierer erfordern, die Folgendes vorhersagen:
    • Quadrat oder nicht
    • Kreis oder nicht
    • Dreieck oder nicht
    • Sechseck oder nicht
  • One-vs-One (OVO): Hierbei wird ein Klassifizierer für jedes mögliche Klassenpaar erstellt. Das Klassifizierungsproblem mit vier Formklassen würde die folgenden binären Klassifizierer erfordern:
    • Quadrat oder Kreis
    • Quadrat oder Dreieck
    • Quadrat oder Sechseck
    • Kreis oder Dreieck
    • Kreis oder Sechseck
    • Dreieck oder Sechseck

Bei beiden Ansätzen muss das Gesamtmodell alle diese Vorhersagen berücksichtigen, um zu bestimmen, zu welcher einzelnen Kategorie das Element gehört.

Glücklicherweise ist die Implementierung eines Multiklassen-Klassifizierungsmodells in den meisten Machine Learning-Frameworks, einschließlich Scikit-Learn, nicht wesentlich komplexer als die binäre Klassifizierung. In den meisten Fällen unterstützen die für die binäre Klassifizierung verwendeten Schätzer implizit die Multiklassen-Klassifizierung, indem sie einen OVR-Algorithmus oder einen OVO-Algorithmus abstrahieren oder die Auswahl einer dieser beiden Möglichkeiten zulassen.