Was sind Klassifizierungsmodelle?
Klassifizierungsmodelle werden verwendet, um Entscheidungen zu treffen oder Elemente Kategorien zuzuweisen. Im Gegensatz zu Regressionsmodulen, bei denen fortlaufende Zahlen ausgegeben werden, z. B. Höhen oder Gewichte, werden bei Klassifizierungsmodellen boolesche Werte (entweder true
oder false
) oder Kategorieentscheidungen, z. B. apple
, banana
, oder cherry
ausgegeben.
Es gibt viele Arten von Klassifizierungsmodellen. Einige davon funktionieren ähnlich wie klassische Regressionsmodelle, während andere sich hiervon grundlegend unterscheiden. Eines der besten Modelle für den Einstieg hat die Bezeichnung logistische Regression.
Was ist die logistische Regression?
Die logistische Regression ist eine Art von Klassifizierungsmodell, das ähnlich wie die lineare Regression funktioniert. Der Unterschied zwischen dieser und der linearen Regression ist die Form der Kurve. Bei der einfachen linearen Regression wird eine gerade Linie an Daten angepasst, während bei den Modellen der logistischen Regression eine Kurve mit S-Form angepasst wird:
Die logistische Regression eignet sich besser als die lineare Regression für das Schätzen von booleschen Ergebnissen, weil bei der logistischen Kurve immer ein Wert zwischen 0 (false) und 1 (true) erzeugt wird. Alle Werte, die zwischen diesen beiden Werten liegen, können als Wahrscheinlichkeit angesehen werden.
Angenommen, wir möchten vorhersagen, ob es heute zu einem Lawinenabgang kommen könnte. Wenn wir bei unserem Modell für die logistische Regression den Wert 0,3 erhalten, lautet die Schätzung, dass eine Lawinenwahrscheinlichkeit von 30 % besteht.
Konvertieren von Ausgaben in Kategorien
Da wir bei der logistischen Regression diese Wahrscheinlichkeiten erhalten, anstatt nur einfache true/false-Werte, müssen wir zusätzliche Schritte ausführen, um das Ergebnis in eine Kategorie zu konvertieren. Die einfachste Möglichkeit zur Durchführung dieser Konvertierung besteht in der Anwendung eines Schwellenwerts. Im folgenden Graphen ist der Schwellenwert beispielsweise auf 0,5 festgelegt. Dieser Schwellenwert bedeutet, dass jeder y-Wert unter 0,5 in „false“ (Feld links unten) und jeder Wert über 0,5 in „true“ (Feld rechts oben) konvertiert wird.
Bei Betrachtung des Graphen erkennen wir, dass, wenn der Wert des Merkmals (Englisch: Feature) kleiner als 5 ist, die Wahrscheinlichkeit unterhalb von 0,5 liegt, und die Konvertierung in „false“ wird durchgeführt. Für Merkmalswerte, die größer als 5 sind, liegen die Wahrscheinlichkeiten oberhalb von 0,5, und die Konvertierung in „true“ wird durchgeführt.
Hierbei ist die Information wichtig, dass die logistische Regression nicht auf ein true/false-Ergebnis beschränkt sein muss. Sie kann auch genutzt werden, wenn es drei oder mehr mögliche Ergebnisse gibt, z. B. rain
, snow
, oder sun
. Für diesen Ergebnistyp ist eine etwas komplexere Einrichtung erforderlich, die als multinomiale logistische Regression bezeichnet wird. Zwar führen wir in den nächsten Übungen keine multinomiale logistische Regression durch, doch Sie können sich diesen Ansatz für Situationen merken, in denen Sie Vorhersagen treffen müssen, die nicht binärer Art sind.
Beachten Sie auch, dass bei der logistischen Regression mehr als ein Eingabemerkmal verwendet werden kann. Zu diesem Fall erfahren Sie später noch mehr.