Trainieren eines Modells

Artikel
05/06/2019

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Siehe Migrieren zu Azure Machine Learning
Weitere Informationen zu Azure Machine Learning.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Trainiert ein Klassifikations- oder Regressionsmodell unter Überwachung.

Kategorie: Machine Learning/Trainieren

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Train Model in Machine Learning Studio (classic) verwenden, um ein Klassifizierungs- oder Regressionsmodell zu trainieren. Das Training findet statt, nachdem Sie ein Modell definiert und die zugehörigen Parameter festgelegt haben. Für das Training werden markierte Daten benötigt. Darüber hinaus können Sie Train Model auch verwenden, um ein bestehendes Modell erneut anhand neuer Daten zu trainieren.

So funktioniert der Trainingsprozess

In Machine Learning ist das Erstellen und Verwenden eines Machine Learning-Modells in der Regel ein dreistufiger Prozess.

Um ein Modell zu konfigurieren, wählen Sie einen bestimmten Algorithmustyp aus und definieren dann die zugehörigen Parameter oder Hyperparameter. Wählen Sie einen der folgenden Modelltypen:
- Klassifizierungsmodelle, die auf neuronalen Netzen, Entscheidungsstrukturen, Entscheidungsgestrukturen und anderen Algorithmen basieren.
- Regressionsmodelle, die standardmäßige lineare Regression umfassen können oder andere Algorithmen verwenden, einschließlich neuronaler Netze und baysischer Regression.
Geben Sie ein Dataset an, das mit einer Bezeichnung versehen wurde und über Daten verfügt, die mit dem Algorithmus kompatibel sind. Verbinden Sie sowohl die Daten als auch das Modell mit Train Model.

Das Training erzeugt ein bestimmtes Binärformat, das iLearner, das die statistischen Muster kapselt, die aus den Daten gelernt wurden. Sie können dieses Format nicht direkt ändern oder lesen. Allerdings können andere Module in Studio (klassisch) dieses trainierte Modell verwenden.

Darüber hinaus können Sie die Eigenschaften des Modells anzeigen. Weitere Informationen finden Sie im Abschnitt Ergebnisse .
Nach Abschluss des Trainings verwenden Sie das trainierte Modell mit einem der Bewertungsmodule, um Vorhersagen für neue Daten zu treffen.

Hinweis

Andere spezialisierte Machine Learning-Aufgaben erfordern unterschiedliche Trainingsmethoden, und Studio (klassisch) stellt separate Trainingsmodule für sie zur Verfügung. Beispielsweise verwenden Bilderkennung, Clustering und Anomalieaberkennung benutzerdefinierte Trainingsmethoden. Train Model ist nur für die Verwendung mit Regressions- und Klassifizierungsmodellen vorgesehen.

Überwachtes und nicht überwachtes Training

Möglicherweise haben Sie die Begriffe überwachtes odernicht überwachtes Lernen gehört . Das Trainieren eines Klassifizierungs- oder Regressionsmodells mit Train Model ist ein klassisches Beispiel für überwachtes maschinelles Lernen. Das bedeutet, dass Sie ein Dataset bereitstellen müssen, das Verlaufsdaten enthält, aus denen Muster gelernt werden können. Die Daten sollten sowohl das Ergebnis (Bezeichnung), das Sie vorhersagen möchten, als auch verwandte Faktoren (Variablen) enthalten. Das Machine Learning-Modell benötigt die Ergebnisse, um die Features zu bestimmen, die die Ergebnisse am besten vorhersagen.

Während des Trainingsprozesses werden die Daten nach Ergebnissen sortiert, und der Algorithmus extrahiert statistische Muster, um das Modell zu erstellen.

Das unbeaufsichtigte Lernen gibt entweder an, dass das Ergebnis unbekannt ist, oder Sie entscheiden sich dafür, keine bekannten Bezeichnungen zu verwenden. Clusteringalgorithmen verwenden z. B. in der Regel nicht überwachte Lernmethoden, können jedoch Bezeichnungen verwenden, falls verfügbar. Ein weiteres Beispiel ist die Themenmodellierung mit LDA. Sie können Train Model nicht mit diesen Algorithmen verwenden.

Tipp

Haben Sie noch keine Erfahrung mit maschinellem Lernen? In diesem Tutorial erfahren Sie Schritt für Schritt, wie Sie Daten abrufen, einen Algorithmus konfigurieren, trainieren und dann ein Modell verwenden: Erstellen Ihres ersten Machine Learning-Experiments

Verwenden von Train Model

Konfigurieren Machine Learning In Machine Learning Studio (klassisch) ein Klassifizierungsmodell oder Regressionsmodellmodelle.

Sie können auch ein benutzerdefiniertes Modell trainieren, das mithilfe von R-Modell erstellen erstellt wurde.
Fügen Sie dem Experiment das Modul Train Model hinzu. Sie finden dieses Modul unter der Kategorie Machine Learning. Erweitern Sie Train (Trainieren), und ziehen Sie das Modul Train Model dann in Ihr Experiment.
Fügen Sie den untrainierten Modus an die linke Eingabe an. Fügen Sie das Trainingsdataset an die rechte Eingabe von Train Model an.

Das Trainingsdataset muss eine Bezeichnungsspalte enthalten. Zeilen ohne Bezeichnung werden ignoriert.
Klicken Sie für Label column (Bezeichnungsspalte) auf Launch column selector (Spaltenauswahl starten), und wählen Sie eine einzelne Spalte mit Ergebnissen aus, die vom Modell zu Trainingszwecken verwendet werden können.
- Bei Klassifizierungsproblemen muss die Bezeichnungsspalte entweder kategorische oder diskrete Werte enthalten. Einige Beispiele sind: Ja/keine Bewertung, ein Code oder ein Name zur Klassifizierung von Krankheiten oder eine Gehaltsgruppe. Wenn Sie eine Spalte mit nicht kategorischen Werten auswählen, gibt das Modul während des Trainings einen Fehler zurück.
- Bei Regressionsproblemen muss die Bezeichnungsspalte numerische Daten enthalten, die die Antwortvariable darstellen. Im Idealfall stellen die numerischen Daten eine fortlaufende Skala dar.
Beispiele sind: eine Kreditrisikobewertung, die prognostizierte Zeit bis zum Ausfall einer Festplatte oder die vorausgesagte Anzahl von Call-Center-Anrufen an einem bestimmten Tag oder zu einer bestimmten Uhrzeit. Wenn Sie keine numerische Spalte auswählen, kann dies zu einem Fehler führen.
- Wenn Sie nicht angeben, welche Bezeichnungsspalte verwendet werden soll, versucht Machine Learning, die entsprechende Bezeichnungsspalte mithilfe der Metadaten des Datasets daraus zu schließen. Wenn die falsche Spalte ausgewählt wird, korrigieren Sie dies mithilfe der Spaltenauswahl.
Tipp

Tipps zur richtigen Verwendung der Spaltenauswahl finden Sie im Artikel zum Auswählen von Spalten im Dataset. Dort werden einige häufige Szenarien beschrieben, und Sie erhalten Tipps zur Verwendung der Optionen WITH RULES und BY NAME.
Führen Sie das Experiment aus. Wenn Sie über eine große Datenmenge verfügen, kann dies eine Weile dauern.

Ergebnisse

Nachdem das Modell trainiert wurde:

Um Modellparameter und Featuregewichtungen anzuzeigen, klicken Sie mit der rechten Maustaste auf die Ausgabe, und wählen Sie Visualize (Visualisieren) aus.
Um das Modell in weiteren Experimenten zu verwenden, klicken Sie mit der rechten Maustaste auf das Modell, und wählen Sie Save Model (Modell speichern) aus. Geben Sie einen Namen für das Modell ein.

Dadurch wird das Modell als Momentaufnahme gespeichert, die durch wiederholte Ausführungen des Experiments aber nicht aktualisiert wird.
Um das Modell zur Vorhersage neuer Werte zu verwenden, verbinden Sie es mit dem Modul Score Model (Modell bewerten) sowie mit neuen Eingabedaten.

Wenn Sie einen Modelltyp trainieren müssen, der nicht von Train Model unterstützt wird, gibt es mehrere Optionen:

Erstellen Sie eine benutzerdefinierte Bewertungsmethode mithilfe eines R-Skripts, oder verwenden Sie eines der vielen verfügbaren R-Bewertungspakete.
- Create R Model
- Ausführen von R-Skripts
Schreiben Sie Ihr eigenes Python-Skript, um ein Modell zu trainieren und zu bewertung, oder verwenden Sie eine vorhandene Python-Bibliothek:
- Ausführen von Python-Skripts
Anomalieerkennungsmodelle
- Train Anomaly Detection Model unterstützt die Anomalieerkennungsmodule in Studio (klassisch).
Empfehlungsmodelle
- Wenn Ihr Modell die in diesem Artikel bereitgestellte Matchbox-Empfehlung Machine Learning, verwenden Sie das Modul Train Matchbox Recommender.
- Wenn Sie einen anderen Algorithmus für die Warenkorbanalyse oder -empfehlung verwenden, verwenden Sie dessen Trainingsmethoden in R-Skripts oder Python-Skripts.
Clustermodelle
- Verwenden Sie Train Clustering Model für den enthaltenen K-Means-Algorithmus.
- Verwenden Sie für andere Clusteringmodelle R-Skript- oder Python-Skriptmodule , um die Modelle zu konfigurieren und zu trainieren.

Beispiele

Beispiele für die Verwendung des Moduls Train Model in Machine Learning-Experimenten finden Sie in den folgenden Experimenten im Azure KI-Katalog:

Einzelhandelsprognose: Veranschaulicht das Erstellen, Trainieren und Vergleichen mehrerer Modelle.
Vorhersage von Flugverspätungen: Veranschaulicht, wie mehrere zugehörige Klassifizierungsmodelle trainiert werden.

Erwartete Eingaben

Name	Type	BESCHREIBUNG
Untrainiertes Modell	ILearner-Schnittstelle	Untrainierter Lerner
Dataset	Datentabelle	Trainingsdaten

Modulparameter

Name	Range	type	Standard	Beschreibung
Bezeichnungsspalte	any	ColumnSelection		Auswählen der Spalte, die die Bezeichnung enthält, oder der Ergebnisspalte

Ausgaben

Name	Type	BESCHREIBUNG
Trainiertes Modell	ILearner-Schnittstelle	Trainiertes Lernmodul

Ausnahmen

Eine Liste aller Modulfehler finden Sie unter Modulfehlercodes.

Ausnahme	Beschreibung
Fehler 0032	Eine Ausnahme tritt auf, wenn das Argument keine Zahl ist.
Fehler 0033	Eine Ausnahme tritt auf, wenn das Argument „Infinity“ (Unendlich) ist.
Fehler 0083	Eine Ausnahme tritt auf, wenn das für das Training verwendete Dataset nicht für einen konkreten Learnertyp verwendet werden kann.
Fehler 0035	Eine Ausnahme tritt auf, wenn für einen bestimmten Benutzer oder ein bestimmtes Element keine Features bereitgestellt wurden.
Fehler 0003	Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0020	Eine Ausnahme tritt auf, wenn die Anzahl der Spalten in einigen der an das Modul übergebenen Datasets zu klein ist.
Fehler 0021	Eine Ausnahme tritt auf, wenn die Anzahl der Zeilen in einigen der an das Modul übergebenen Datasets zu klein ist.
Fehler 0013	Die Ausnahme tritt auf, wenn das an das Modul übergebene Lernmodul einen ungültigen Typ hat.

Siehe auch

Auswertungsmodell
Modulliste von A bis Z