Was ist maschinelles Lernen?
Maschinelles Lernen hat seinen Ursprung in der Statistik und mathematischen Modellierung von Daten. Die Grundidee des maschinellen Lernens besteht darin, Daten aus früheren Beobachtungen zu verwenden, um unbekannte Ergebnisse oder Werte vorherzusagen. Beispiel:
- Der Besitzer einer Eisdiele könnte eine App verwenden, die historische Umsatz- und Wetteraufzeichnungen kombiniert, um basierend auf der Wettervorhersage vorherzusagen, wie viel Eiscreme er wahrscheinlich an einem bestimmten Tag verkaufen wird.
- Ärzt*innen könnten klinische Daten früherer Patient*innen verwenden, um automatische Tests durchzuführen, die anhand von Faktoren wie Gewicht, Blutzuckerspiegel und anderen Messwerten vorhersagen, ob für neue Patient*innen ein Diabetesrisiko besteht.
- Forschende in der Antarktis könnten frühere Beobachtungen verwenden, um die Identifizierung verschiedener Pinguinarten (wie Adeliepinguin, Eselspinguin oder Zügelpinguin) basierend auf Messungen der Flossen, des Schnabels und anderer physischer Attribute eines Vogels automatisieren.
Maschinelles Lernen als Funktion
Da maschinelles Lernen auf Mathematik und Statistik basiert, ist es üblich, über Machine Learning-Modelle in mathematischen Begriffen zu denken. Grundsätzlich ist ein Machine Learning-Modell eine Softwareanwendung, die eine Funktion zur Berechnung eines Ausgabewerts basierend auf einem oder mehreren Eingabewerten kapselt. Der Prozess des Definierens dieser Funktion wird als Training bezeichnet. Nachdem die Funktion definiert wurde, können Sie sie verwenden, um neue Werte in einem Prozess namens Rückschließen vorherzusagen.
Lassen Sie uns die Schritte untersuchen, die mit dem Training und Rückschließen verbunden sind.
Die Trainingsdaten bestehen aus früheren Beobachtungen. In den meisten Fällen umfassen die Beobachtungen die beobachteten Attribute oder Features der beobachteten Sache und den bekannten Wert der Sache, für die Sie ein Modell trainieren möchten, um sie vorherzusagen (auch Bezeichnung genannt).
In der Mathematik werden die Features oft mit dem Kurzvariablennamen x und die Bezeichnung mit y bezeichnet. In der Regel besteht eine Beobachtung aus mehreren Featurewerten. Daher ist x tatsächlich ein Vektor (ein Array mit mehreren Werten), wie folgt: [x1,x2,x3,...].
Um dies zu verdeutlichen, betrachten wir die zuvor beschriebenen Beispiele:
- Im Eisdielenszenario ist es unser Ziel, ein Modell zu trainieren, das die Anzahl der Eisverkäufe auf der Grundlage des Wetters vorhersagen kann. Die Wettermessungen für den Tag (Temperatur, Niederschlag, Windgeschwindigkeit usw.) wären die Features (x), und die Anzahl der an jedem Tag verkauften Eissorten wäre die Bezeichnung (y).
- Im medizinischen Szenario geht es darum, anhand der klinischen Messwerte vorherzusagen, ob für Patient*innen ein Diabetesrisiko besteht oder nicht. Die Messwerte der Patient*innen (Gewicht, Blutzuckerspiegel usw.) sind die Features (x), und die Diabeteswahrscheinlichkeit (z. B. 1 für risikobehaftet, 0 für nicht gefährdet) ist die Bezeichnung (y).
- Im Antarktisforschungsszenario wollen wir die Pinguinart anhand seiner physischen Attribute vorhersagen. Die Schlüsselmaße des Pinguins (Länge seiner Flossen, Breite seines Schnabels usw.) sind die Features (x), und die Art (z. B. 0 für Adelie, 1 für Eselspinguin oder 2 für Zügelpinguin) ist die Bezeichnung (y).
Ein Algorithmus wird auf die Daten angewendet, um eine Beziehung zwischen den Features und der Bezeichnung zu ermitteln und diese Beziehung als Berechnung zu verallgemeinern, die mit x durchgeführt werden kann, um y zu berechnen. Der jeweils verwendete Algorithmus hängt von der Art des Vorhersageproblems ab, das Sie zu lösen versuchen (dazu später mehr), aber das Grundprinzip besteht darin, zu versuchen, eine Funktion an die Daten anzupassen, in der die Werte der Features zum Berechnen der Bezeichnung verwendet werden können.
Das Ergebnis des Algorithmus ist ein Modell, das die vom Algorithmus abgeleitete Berechnung als Funktion kapselt, die wir f nennen. Mathematische Notation:
y = f(x)
Nachdem die Trainingsphase abgeschlossen ist, kann das trainierte Modell zum Rückschließen verwendet werden. Das Modell ist im Wesentlichen ein Softwareprogramm, das die durch den Trainingsprozess erzeugte Funktion kapselt. Sie können eine Reihe von Featurewerten eingeben und erhalten als Ausgabe eine Vorhersage der entsprechenden Bezeichnung. Da es sich bei der Ausgabe des Modells um eine Vorhersage handelt, die von der Funktion berechnet wurde, und nicht um einen beobachteten Wert, wird die Ausgabe der Funktion häufig als ŷ angezeigt (was sehr schön als „y mit Hut“ beschrieben wird).