Trainieren eines Clusteringmodells

Artikel
05/06/2019

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Siehe Migrieren zu Azure Machine Learning
Weitere Informationen zu Azure Machine Learning.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Trainiert ein Clusteringmodell und weist Daten aus dem Trainingsset zu Clustern zu.

Kategorie: Machine Learning/Trainieren

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Train Clustering Model in Machine Learning Studio (klassisch) verwenden, um ein Clustermodell zu trainieren.

In diesem Modul wird ein untrainiertes Clusteringmodell verwendet, das Sie bereits mithilfe des Moduls K-Means Clustering konfiguriert haben. Das Modul trainiert das Modell mit einem bezeichneten oder unbezeichneten Datensatz. Das Modul erstellt sowohl ein trainiertes Modell, das Sie für Vorhersagen verwenden können, als auch eine Reihe von Clusterzuweisungen für jeden Fall in den Trainingsdaten.

Hinweis

Ein Clustermodell kann nicht mithilfe des Moduls Train Model trainiert werden, das das generische Modul zum Erstellen von Machine Learning-Modellen ist. Das liegt daran, dass Train Model nur mit überwachten Lernalgorithmen funktioniert. k-Means- und andere Clusteringalgorithmen ermöglichen unüberwachtes Lernen, was bedeutet, dass der Algorithmus aus unbezeichneten Daten lernen kann.

Verwenden des Moduls „Train Clustering Model“

Fügen Sie ihrem Experiment in Studio (klassisch) das Modul Train Clustering Model hinzu. Sie finden das Modul unter Machine Learning Modulesin der Kategorie Train.
Fügen Sie das Modul K-Means Clustering oder ein anderes benutzerdefiniertes Modul hinzu, mit dem ein kompatibles Clusteringmodell erstellt wird, und legen Sie dessen Parameter fest.
Fügen Sie das Trainingsdataset an die rechte Eingabe von Train Clustering Model an.
Wählen Sie unter Column Set (Spaltengruppe) die Spalten aus dem Dataset aus, die zum Erstellen von Clustern verwendet werden sollen. Achten Sie darauf, Spalten auszuwählen, die gute Features bieten. Vermeiden Sie z.B. die Verwendung von IDs oder anderen Spalten mit eindeutigen oder identischen Werten.

Wenn eine Bezeichnung verfügbar ist, können Sie sie entweder als Feature verwenden oder weglassen.
Wählen Sie die Option Check for Append (Nach Anfügen suchen) oder Uncheck for Result Only (Nur Ergebnis) aus, wenn Sie die Trainingsdaten zusammen mit der neuen Clusterbezeichnung ausgeben möchten.

Wenn Sie diese Option deaktivieren, werden nur die Clusterzuweisungen ausgegeben.
Führen Sie das Experiment aus, oder klicken Sie auf das Modul Train Clustering Model und dann auf Run Selected (Ausgewählte ausführen).

Ergebnisse

Nach Abschluss des Trainings:

Um den Cluster und seine Trennung in einem Diagramm anzuzeigen, klicken Sie mit der rechten Maustaste auf die Ausgabe des Resultsdatasets , und wählen Sie Visualisieren aus.

Das Diagramm stellt die Hauptkomponenten des Clusters und nicht die tatsächlichen Werte dar. Weitere Informationen finden Sie unter Prinzipalkomponentenanalyse .
Um die Werte im Dataset anzuzeigen, fügen Sie eine Instanz des Moduls Convert to Dataset (In Dataset konvertieren ) hinzu, und verbinden Sie es mit der Ausgabe des Results-Datasets . Führen Sie das Modul Convert to Dataset (In Dataset konvertieren) aus, um eine Kopie der Daten abzurufen, die Sie anzeigen oder herunterladen können.
Um das trainierte Modell für die spätere Wiederverwendung zu speichern, klicken Sie mit der rechten Maustaste auf das Modul. Wählen Sie Trained model (Trainiertes Modell) aus, und klicken Sie auf Save As Trained Model (Als trainiertes Modell speichern).
Verwenden Sie zum Generieren von Ergebnissen aus dem Modell Assign Data to Clusters (Zuweisen von Daten zu Clustern).

Beispiele

Ein Beispiel für die Verwendung von Clustering beim maschinellen Lernen finden Sie im Azure KI-Katalog:

Clustering: Suchen ähnlicher Unternehmen: Veranschaulicht die Verwendung von Clustering für Attribute, die aus unstrukturiertem Text abgeleitet wurden.
Clustering: Farbquantisierung: Veranschaulicht die Verwendung von Clustering, um verwandte Farben zu suchen und die Anzahl der in Bildern verwendeten Bits zu reduzieren.
Clustering: Gruppieren von Irisdaten: Stellt ein einfaches Beispiel für das Clustering basierend auf dem Iris-Dataset bereit.

Erwartete Eingaben

Name	Type	BESCHREIBUNG
Untrainiertes Modell	ICluster-Schnittstelle	Untrainiertes Clusteringmodell
Dataset	Datentabelle	Eingabedatenquelle

Modulparameter

Name	Range	type	Standard	Beschreibung
Column Set	any	ColumnSelection		Spaltenauswahlmuster
Check for Append or Uncheck for Result Only	any	Boolean	true	Ob das Ausgabedataset das Eingabedataset mit angefügter Zuweisungsspalte (aktiviert) oder nur die Zuweisungsspalte enthalten muss (deaktiviert)

Ausgaben

Name	Type	BESCHREIBUNG
Trainiertes Modell	ICluster-Schnittstelle	Trainiertes Clusteringmodell
Ergebnisdataset	Datentabelle	Eingabedataset mit angefügter Zuweisungsdatenspalte oder nur Zuweisungsspalte

Ausnahmen

Ausnahme	Beschreibung
Fehler 0003	Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Modulliste von A bis Z
Trainieren
Assign Data to Clusters (Zuweisen von Daten zu Clustern)
K-Means-Clustering