Machine Learning – Trainieren

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel werden die Module beschrieben, die in Machine Learning Studio (klassisch) zum Trainieren eines Machine Learning-Modells bereitgestellt werden. Training ist der Prozess der Analyse von Eingabedaten mithilfe der Parameter eines vordefinierten Modells. Aus dieser Analyse lernt das Modell die Muster und speichert sie in Form eines trainierten Modells.

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

In diesem Artikel wird auch der allgemeine Prozess in Machine Learning Studio (klassisch) für die Modellerstellung, das Training, die Auswertung und die Bewertung beschrieben.

Erstellen und Verwenden von Machine Learning-Modellen

Der typische Workflow für maschinelles Lernen umfasst diese Phasen:

  • Auswählen eines geeigneten Algorithmus und Festlegen der anfänglichen Optionen.
  • Trainieren des Modells mit kompatiblen Daten.
  • Erstellen von Vorhersagen mithilfe neuer Daten basierend auf den Mustern im Modell.
  • Auswerten des Modells, um zu bestimmen, ob die Vorhersagen genau sind, wie viele Fehler vorliegen und ob eine Überanpassung vorliegt.

Machine Learning Studio (klassisch) unterstützt ein flexibles, anpassbares Framework für maschinelles Lernen. Jede Aufgabe in diesem Prozess wird von einem bestimmten Modultyp ausgeführt, der geändert, hinzugefügt oder entfernt werden kann, ohne den Rest des Experiments zu verändern.

Die Module in dieser Kategorie unterstützen das Training für verschiedene Modelltypen. Während des Trainings werden die Daten vom Machine Learning-Algorithmus analysiert. Dieser Algorithmus analysiert die Verteilung und den Typ der Daten, kompiliert Statistiken und erstellt Muster, die später für vorhersagen verwendet werden können.

Weitere Informationen zum Modelltraining

Wenn Machine Learning ein Modell trainiert, werden Zeilen mit fehlenden Werten übersprungen. Wenn Sie die Werte manuell korrigieren, eine Imputation verwenden oder eine andere Methode für die Behandlung fehlender Werte angeben möchten, verwenden Sie daher das Modul Clean Missing Data (Fehlende Daten bereinigen ), bevor Sie mit dem Dataset trainieren.

Es wird empfohlen, das Modul Edit Metadata (Metadaten bearbeiten ) zu verwenden, um andere Probleme mit den Daten zu beheben. Möglicherweise müssen Sie die Bezeichnungsspalte markieren, Datentypen ändern oder Spaltennamen korrigieren.

Weitere allgemeine Datenbereinigungsaufgaben wie Normalisierung, Stichprobenentnahme, Binning und Skalierung finden Sie in der Kategorie Datentransformation .

Auswählen des richtigen Trainers

Die Methode, die Sie zum Trainieren eines Modells verwenden, hängt vom Typ des Modells ab, das Sie erstellen, und vom Typ der Daten, die das Modell benötigt. beispielsweise stellt Machine Learning Module bereit, die speziell zum Trainieren von Anomalieerkennungsmodellen, Empfehlungsmodellen und mehr dienen.

Überprüfen Sie die Liste der Trainingsmodule , um zu ermitteln, welches Modul für Ihr Szenario geeignet ist.

Wenn Sie sich nicht sicher sind, welche Parameter beim Trainieren eines Modells am besten geeignet sind, verwenden Sie eines der Module, die für parameter sweeping und validation bereitgestellt werden:

  • Tune Model Hyperparameters kann einen Parameter sweep für fast alle Klassifizierungs- und Regressionsmodelle ausführen. Es trainiert mehrere Modelle und gibt dann das beste Modell zurück.

  • Das Sweep Clustering-Modul unterstützt die Modelloptimierung während des Trainingsprozesses und ist nur für die Verwendung mit Clustermodellen vorgesehen. Sie können einen Bereich von Schwerpunkten angeben und mit Daten trainieren, während Sie automatisch die besten Parameter erkennen.

  • Das Modul Cross-Validate Model ist auch für die Modelloptimierung nützlich, gibt aber kein trainiertes Modell zurück. Stattdessen stellt sie Metriken bereit, mit denen Sie das beste Modell bestimmen können.

Erneutes Trainieren von Modellen

Wenn Sie ein Produktionsmodell erneut trainieren müssen, können Sie das Experiment jederzeit erneut ausführen.

Sie können den Erneuttrainingsprozess auch mithilfe von Webdiensten automatisieren. Eine exemplarische Vorgehensweise finden Sie unter Erneutes Training und Aktualisieren Machine Learning Modellen mit Azure Data Factory.

Verwenden von vortrainierten Modellen

Machine Learning enthält einige Modelle, die vorab trainiert sind, z. B. das Modul Vortrainierte Kaskadierte Bildklassifizierung. Sie können diese Modelle für die Bewertung ohne zusätzliche Dateneingabe verwenden.

Außerdem generieren einige Module (z. B. die Anomalieerkennung von Zeitreihen) kein trainiertes Modell im iLearner-Format. Sie verwenden jedoch Trainingsdaten und erstellen intern ein Modell, das dann zum Treffen von Vorhersagen verwendet werden kann. Um diese zu verwenden, konfigurieren Sie einfach die Parameter und stellen Daten bereit.

Speichern einer Momentaufnahme eines trainierten Modells

Wenn Sie das Modell speichern oder exportieren möchten, klicken Sie mit der rechten Maustaste auf das Trainingsmodul, und wählen Sie Als trainiertes Modell speichern aus. Das Modell wird in das iLearner-Format exportiert und in Ihrem Arbeitsbereich unter Trainierte Modelle gespeichert. Trainierte Modelle können in anderen Experimenten wiederverwendet oder zur Bewertung mit anderen Modulen verbunden werden.

Sie können auch das Modul Load Trained Model in einem Experiment verwenden, um ein gespeichertes Modell abzurufen.

Liste der Module

Die Kategorie Trainieren umfasst die folgenden Module:

Einige Module befinden sich nicht in dieser Kategorie, da sie ein spezielles Format erfordern oder für eine bestimmte Aufgabe angepasst werden:

Siehe auch