Zusammenfassung
Wir haben unsere Einführung in die Klassifizierung abgeschlossen. Lassen Sie uns also einige wichtige Punkte erneut zusammenfassen.
Wir haben gesehen, dass die Klassifizierung in vielen Bereichen mit der klassischen Regression übereinstimmt. Für beide Verfahren können wir das beaufsichtigte Lernen, eine Kostenfunktion und Test- und Trainingsdatasets verwenden, um die Leistung beim Einsatz in der realen Welt einzuschätzen. Der Schwerpunkt hat hier auf der logistischen Regression gelegen, bei der es sich fast um eine Hybridversion dieser beiden Modellarten handelt. Es wurde gezeigt, wie wir durch das Anwenden eines Schwellenwerts auf die Ausgabe eine Kategorienbezeichnung, z. B. avalanche
/no-avalanche
, erhalten.
Darüber hinaus wurde beschrieben, warum das Bewerten von Klassifizierungsmodellen etwas schwieriger als bei Regressionsmodellen sein kann. Ein wichtiger Grund hierfür ist, dass die zugehörigen Kostenfunktionen häufig nicht intuitiv sind.
Wir haben auch untersucht, wie das Hinzufügen und Kombinieren von Merkmalen zu erheblichen Modellverbesserungen führen kann. Eine wichtige Erkenntnis war, dass eine sorgfältige Untersuchung der Bedeutung Ihrer Daten der Schlüssel zur Erzielung des bestmöglichen Ergebnisses ist.
In diesem Modul haben wir mit logistischer Regression gearbeitet. Denken Sie jedoch daran, dass die meisten der hier behandelten Themen auch auf viele andere Arten von Klassifizierungsmodellen zutreffen. Einschließlich Modellen, die versuchen, mehr als zwei mögliche Kategorien vorherzusagen.