Was ist Automated Machine Learning (AutoML)?

2024-12-30

Automatisiertes Maschinelles Lernen (AutoML) automatisiert den Prozess der Anwendung von maschinellem Lernen auf Daten. Mit einem Dataset können Sie AutoML ausführen, um unterschiedliche Datentransformationen, Machine Learning-Algorithmen und Hyperparameter zur Wahl des besten Modells zu durchlaufen.

Anmerkung

Dieser Artikel bezieht sich auf die ML.NET AutoML-API, die sich derzeit in der Vorschauversion befindet. Material kann sich ändern.

Wie funktioniert AutoML?

Im Allgemeinen lautet der Workflow zum Trainieren von Machine Learning-Modellen wie folgt:

Definieren eines Problems
Sammeln von Daten
Vorverarbeitung von Daten
Trainieren eines Modells
Evaluieren des Modells

herkömmlichen ML- und AutoML-Schulungsworkflows

Vorverarbeitung, Schulung und Auswertung sind ein experimenteller und iterativer Prozess, der mehrere Versuche erfordert, bis Sie zufriedenstellende Ergebnisse erzielen. Da diese Aufgaben tendenziell sich wiederholen, kann AutoML dazu beitragen, diese Schritte zu automatisieren. Neben der Automatisierung werden Optimierungstechniken während des Schulungs- und Evaluierungsprozesses verwendet, um Algorithmen und Hyperparameter zu finden und auszuwählen.

Wann sollte ich AutoML verwenden?

Ganz gleich, ob Sie gerade erst mit maschinellem Lernen beginnen oder erfahrener Benutzer sind, AutoML bietet Lösungen zum Automatisieren des Modellentwicklungsprozesses.

Anfänger – Wenn Sie noch nicht mit maschinellem Lernen arbeiten, vereinfacht AutoML den Modellentwicklungsprozess, indem eine Reihe von Standardwerten bereitgestellt wird, die die Anzahl der Entscheidungen reduziert, die Sie beim Trainieren ihres Modells treffen müssen. Auf diese Weise können Sie sich auf Ihre Daten und das Problem konzentrieren, das Sie lösen möchten, und AutoML den Rest erledigen lassen.
Erfahrenen Benutzern – Wenn Sie Erfahrung mit maschinellem Lernen haben, können Sie die von AutoML bereitgestellten Standardwerte basierend auf Ihren Anforderungen anpassen, konfigurieren und erweitern, während Sie gleichzeitig ihre Automatisierungsfunktionen nutzen.

AutoML in ML.NET

Featurizer: Komfort-API zum Automatisieren der Datenvorverarbeitung.
Testversion: Eine einzelne Ausführung zur Optimierung der Hyperparameter.
Experiment - Eine Sammlung von AutoML-Testversionen. ML.NET stellt eine hochwertige API zum Erstellen von Experimenten bereit, die Standardwerte für die einzelnen Komponenten der Sweepable Pipeline, den Suchbereich und den Tuner festlegt.
Suchbereich: Der Bereich der verfügbaren Optionen zum Auswählen von Hyperparametern.
Tuner – Die Algorithmen, die zum Optimieren von Hyperparametern verwendet werden. ML.NET unterstützt die folgenden Tuner:
- Cost Frugal Tuner: Implementierung der frugalen Optimierung für kostenbezogene Hyperparameter, die die Trainingskosten berücksichtigt
- Eci Cost Frugal Tuner: Implementierung von Cost Frugal Tuner für hierarchische Suchbereiche. Standardmäßiger Tuner, der von AutoML verwendet wird.
- SMAC - Tuner, der zufällige Wälder verwendet, um bayesische Optimierung anzuwenden.
- Rastersuche – Tuner, der am besten für kleine Suchplätze geeignet ist.
- Zufällige Suche
Sweepable Estimator: Ein ML.NET-Schätzer, der einen Suchbereich enthält.
Sweepable Pipeline: Eine ML.NET-Pipeline, die einen oder mehrere Sweepable Estimators enthält.
Trial Runner: AutoML-Komponente, die Sweepable Pipelines und Testeinstellungen verwendet, um Testergebnisse aus Modelltraining und -auswertung zu generieren.

Es wird empfohlen, dass Anfänger mit den Standardwerten beginnen, die von der Experiment-API höherer Ebene bereitgestellt werden. Erfahrenere Benutzer, die nach Anpassungsoptionen suchen, verwenden die Komponenten „Sweepable Estimator“, „Sweepable Pipeline“, „Suchbereich“, „Trial Runner“ und „Tuner“.

Weitere Informationen zu den ersten Schritten mit der AutoML-API finden Sie unter Verwenden der ML.NET-API für automatisiertes Maschinelles Lernen (AutoML).

Unterstützte Aufgaben

AutoML stellt vorkonfigurierte Standardwerte für die folgenden Aufgaben bereit:

Binäre Klassifizierung
Mehrklassenklassifizierung
Regression

Für andere Aufgaben können Sie einen eigenen Testrunner erstellen, der diese Szenarien ermöglicht. Weitere Informationen finden Sie im Leitfaden zur Nutzung der ML.NET Automated Machine Learning (AutoML)-API.

Freigeben über

Was ist Automated Machine Learning (AutoML)?

Wie funktioniert AutoML?

Wann sollte ich AutoML verwenden?

AutoML in ML.NET

Unterstützte Aufgaben

Nächste Schritte

Zusätzliche Ressourcen