Machine Learning und der Data Science-Lebenszyklus
Maschinelles Lernen ist Teil eines großen Wissenschaftsgebiets: Data Science. Es handelt sich im Wesentlichen um die Generierung von Wissen aus Rohdaten.
Die Umwandlung von Rohdaten in Wissen erfordert einen erheblichen Arbeitsaufwand. Stellen Sie sich zum Beispiel vor, Sie haben einen Garten und versuchen, Salat anzubauen. Sie möchten Ihren Garten so optimieren, dass Sie in kürzester Zeit die größte Menge Salat anbauen können. Sie können eine große Menge an Daten sammeln, die beeinflussen können, wie Sie die erfolgreichste Umgebung für den Salatanbau einrichten.
Zu den Faktoren, die Sie berücksichtigen können, zählen Sonneneinstrahlung, Temperatur, Boden- und Luftfeuchtigkeit, Salatsorte und Samenquelle, Frischluftzufuhr, Größe des Pflanzgefäßes, Bodenqualität und Erdmenge. Die Liste könnte noch länger sein, denn es gibt vielleicht einige Faktoren, die das Wachstum beeinflussen, die Ihnen gar nicht bewusst sind, wie z. B. der Lärmpegel oder die Art des Lärms in der Nähe Ihres Gartens.
Data Science-Lebenszyklus
Das Verständnis des Data Science-Lebenszyklus kann Sie bei der Erstellung neuer Kenntnisse aus Datenquellen unterstützen.
Der Data Science-Lebenszyklus besteht aus den folgenden vier Schritten:
- Definieren eines Geschäftsziels auf Grundlage von Fachwissen.
- Sammeln, Bereinigen und Bearbeiten Ihrer Daten.
- Auswählen eines Machine Learning-Algorithmus und anschließendes Trainieren und Testen des Modells.
- Bereitstellen des Modells zur Verwendung mit anderen Anwendungen.
Lesen Sie weiter, um die einzelnen Schritte des Data Science-Lebenszyklus im Detail zu untersuchen.