Zusammenfassung

Abgeschlossen

Wir haben unsere Einführung in die Klassifizierung abgeschlossen. Lassen Sie uns also einige wichtige Punkte erneut zusammenfassen.

Wir haben gesehen, dass die Klassifizierung viel mit der klassischen Regression gemeinsam hat. Für beides können wir überwachtes Lernen, eine Kostenfunktion verwenden und Test- und Train-Datasets verwenden, um die reale Leistung zu schätzen. Wir konzentrierten uns hier auf die logistische Regression, die fast eine Hybride zwischen diesen beiden Modelltypen ist, und zeigten, wie das Schwellenwert des Ergebnisses uns ein kategorisches Label gibt, wie avalanche/no-avalanche.

Wir haben diskutiert, wie die Bewertung von Klassifikationsmodellen etwas schwieriger sein kann als bei Regressionsmodellen, insbesondere weil die beteiligten Kostenfunktionen häufig unintuitiv sind.

Außerdem haben wir untersucht, wie das Hinzufügen und Kombinieren von Features zu erheblichen Modellverbesserungen führen könnte. Wichtig ist, dass wir gezeigt haben, dass das gründliche Nachdenken darüber, was Ihre Daten bedeuten, der Schlüssel zum Erreichen des besten Ergebnisses ist.

In diesem Modul haben wir mit logistischer Regression gearbeitet. Denken Sie jedoch daran, dass die meisten themen, die wir hier behandelt haben, auch auf viele andere Arten von Klassifizierungsmodellen angewendet werden, einschließlich Modellen, die versuchen, mehr als zwei mögliche Kategorien vorherzusagen.