Identifizieren von Machine Learning-Aufgaben
Stellen Sie sich vor, Sie sind eine wissenschaftliche Fachkraft für Daten und haben den Auftrag, ein Machine Learning-Modell zu trainieren.
Sie möchten die folgenden sechs Schritte ausführen, um das Modell zu planen, zu trainieren, bereitzustellen und zu überwachen:
- Definieren des Problems: Entscheiden Sie, was das Modell vorhersagen soll und wann es erfolgreich ist.
- Abrufen der Daten: Suchen Sie nach Datenquellen, und verschaffen Sie sich Zugriff.
- Aufbereiten der Daten: Erkunden Sie die Daten. Bereinigen und transformieren Sie die Daten basierend auf den Anforderungen des Modells.
- Trainieren des Modells: Wählen Sie einen Algorithmus und Hyperparameterwerte auf Grundlage von Versuch und Irrtum.
- Integrieren des Modells: Stellen Sie das Modell an einem Endpunkt bereit, um Vorhersagen zu generieren.
- Überwachen des Modells: Verfolgen Sie die Leistung des Modells.
Hinweis
Das Diagramm ist eine vereinfachte Darstellung des Machine Learning-Prozesses. In der Regel ist der Prozess iterativ und kontinuierlich. Bei der Überwachung des Modells können Sie beispielsweise beschließen, das Modell erneut zu trainieren.
Im ersten Schritt möchten Sie das Problem definieren, das das Modell lösen soll. Dazu müssen Sie Folgendes klären:
- Wie die Ausgabe des Modells aussehen soll.
- Welche Art von Machine Learning-Aufgabe Sie verwenden werden.
- Welche Kriterien zeichnen ein erfolgreiches Modell aus.
Abhängig von den verfügbaren Daten und der erwarteten Ausgabe des Modells können Sie die Machine Learning-Aufgabe identifizieren. Die Aufgabe bestimmt, welche Arten von Algorithmen Sie zum Trainieren des Modells verwenden können.
Einige gängige Machine Learning-Aufgaben sind:
- Klassifizierung: Vorhersage eines kategorischen Werts.
- Regression: Vorhersage eines numerischen Werts.
- Zeitreihenvorhersage: Vorhersagen zukünftiger numerischer Werte basierend auf Zeitreihendaten.
- Maschinelles Sehen: Klassifizieren von Bildern oder Erkennen von Objekten in Bildern.
- Linguistische Datenverarbeitung (Natural Language Processing, NLP): Extrahieren von Erkenntnissen aus Text.
Zum Trainieren eines Modells verfügen Sie über eine Reihe von Algorithmen, die Sie je nach auszuführender Aufgabe verwenden können. Zum Auswerten des Modells können Sie Leistungsmetriken wie die Genauigkeit berechnen. Die verfügbaren Metriken hängen auch von der Aufgabe ab, die Ihr Modell ausführen muss, und helfen Ihnen bei der Entscheidung, ob die Aufgabe eines Modells erfolgreich durchgeführt wurde.
Wenn Sie wissen, welches Problem Sie lösen möchten und wie Sie den Erfolg Ihres Modells bewerten, können Sie den Dienst zum Trainieren und Verwalten Ihres Modells auswählen.