Verbessern von Modellen mit Hyperparametern
Einfache Modelle mit kleinen Datasets können oft in einem einzelnen Schritt angepasst werden, während größere Datasets und komplexere Modelle durch wiederholte Verwendung des Modells mit Trainingsdaten und Vergleich der Ausgabe mit der erwarteten Bezeichnung angepasst werden müssen. Wenn die Vorhersage genau genug ist, betrachten wir das Modell als trainiert. Wenn nicht, passen wir das Modell leicht an und wiederholen den Durchlauf.
Hyperparameter sind Werte, die die Art und Weise der Anpassung des Modells während dieser Durchläufe verändern. Die Lernrate z. B. ist ein Hyperparameter, der festlegt, wie stark ein Modell während der einzelnen Trainingszyklen angepasst wird. Eine hohe Lernrate bedeutet, dass ein Modell schneller trainiert werden kann. Wenn diese jedoch zu hoch ist, können die Anpassungen so umfangreich sein, dass das Modell nie „ausreichend optimiert“ und nicht optimal ist.
Vorverarbeiten von Daten
Die Vorverarbeitung bezieht sich auf Änderungen, die Sie an Ihren Daten vornehmen, bevor sie an das Modell übergeben werden. Sie haben bereits gelesen, dass die Vorverarbeitung das Bereinigen Ihres Datasets umfassen kann. Das ist zwar wichtig, aber die Vorverarbeitung kann auch eine Änderung des Datenformats umfassen, damit es vom Modell leichter verarbeitet kann. Daten, die beispielsweise als „rot“, „orange“, „gelb“, „limone“ und „grün“ beschrieben werden, könnten möglicherweise besser funktionieren, wenn sie in ein Format konvertiert werden, das für Computer besser geeignet ist, z. B. in Zahlen, die den Rot- und Grünanteil angeben.
Skalieren von Features
Der häufigste Vorverarbeitungsschritt besteht im Skalieren von Features, sodass sie zwischen 0 und 1 liegen. Das Gewicht eines Fahrrads und die Entfernung, die eine Person mit dem Fahrrad zurücklegt, können z. B. zwei sehr unterschiedliche Werte sein, aber durch die Skalierung beider Zahlen auf einen Wert zwischen 0 und 1 können die Modelle effektiver aus den Daten lernen.
Verwenden von Kategorien als Features
Beim maschinellen Lernen können Sie auch Featurekategorien wie „Fahrrad“, „Skateboard“ oder „Auto“ verwenden. Diese Features werden durch Werte von 0 oder 1 in One-Hot-Vektoren dargestellt. Dabei handelt es sich um Vektoren mit 0 oder 1 für jeden möglichen Wert. Beispielsweise könnten Fahrrad, Skateboard und Auto jeweils (1,0,0), (0,1,0) und (0,0,1) sein.