Einführung

Abgeschlossen

Die Regression ist ein einfaches, gängiges und äußerst nützliches Datenanalyseverfahren, das umgangssprachlich als „Erstellen einer Trendlinie“ bezeichnet wird. Die Regression identifiziert die Stärke der Beziehung zwischen einem oder mehreren Features und einer einzelnen Bezeichnung. Seine Einfachheit, die gute Vorhersagbarkeit, die Möglichkeit zur Erstellung von Prognosen und die gute Interpretierbarkeit bedeuten, dass dieses Verfahren in Bereichen wie Finanzen, Business, Sozialwissenschaften, Epidemiologie und Medizin genutzt wird.

In diesem Modul sehen wir uns die Funktionsweise der Regression sowie ihre Grenzen genauer an, und Sie erfahren, wie Sie die Leistung bewerten.

Szenario: Überlastung einer Tierklinik

In diesem Modul verwenden wir durchgängig das im Folgenden beschriebene Szenario, um die grundlegenden Konzepte der Regression zu erläutern. Dieses Szenario soll als Beispiel dafür dienen, wie Sie dieses Verfahren beim Analysieren von in der Zukunft anfallenden Daten ggf. nutzen können.

In der von Ihnen betriebenen Lawinenhund-Hilfseinrichtung ist es vermehrt zu Krankheitsfällen gekommen. Nach einem Trainingstag und einigen sozialen Aktivitäten sind viele Hunde krank geworden, und das vorrangige Symptom war Fieber (erhöhte Körpertemperatur). Aus Sorge um die Hunde, die noch keine Symptome zeigen, hat Ihr Team grundlegende Informationen zu den ersten 100 erkrankten Hunden zusammengetragen. Ihre Aufgabe ist nun die Ermittlung, bei welchen Hunden das Risiko einer Erkrankung erhöht ist, damit sie vom Tierarzt prophylaktisch untersucht werden können.

Lernziele

In diesem Modul wird Folgendes thematisiert:

  • Grundlegendes zur Funktionsweise der Regression
  • Verwendung von neuen Algorithmen: lineare Regression, multiple lineare Regression und Polynomregression
  • Grundlegendes zu den Vorteilen und Einschränkungen von Regressionsmodellen
  • Visualisieren von Fehler- und Kostenfunktionen bei der linearen Regression
  • Grundlegendes zu einfachen Auswertungsmetriken für die Regression

Voraussetzungen

  • Erfahrung mit Machine Learning-Modellen