Share via


Clusteringmodule

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel werden die Module in Machine Learning Studio (klassisch) beschrieben, die die Erstellung von Clustermodellen unterstützen.

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Was ist Clustering?

Clustering ist beim maschinellen Lernen eine Methode zum Gruppieren von Datenpunkten in ähnlichen Clustern. Dies wird auch als Segmentierung bezeichnet.

Im Laufe der Jahre wurden viele Clusteringalgorithmen entwickelt. Fast alle Clusteringalgorithmen verwenden die Features einzelner Elemente, um ähnliche Elemente zu finden. Beispielsweise können Sie Clustering anwenden, um ähnliche Personen anhand demografischer Daten zu finden. Sie können Clustering mit Textanalyse verwenden, um Sätze mit ähnlichen Themen oder Stimmungen zu gruppieren.

Clustering wird als nicht überwachtes Lernverfahren bezeichnet, da es in Nichtbeschriftungsdaten verwendet werden kann. Tatsächlich ist das Clustering ein nützlicher erster Schritt zum Ermitteln neuer Muster und erfordert nur wenig Vorkenntnisse darüber, wie die Daten strukturiert sein können oder wie Elemente miteinander in Beziehung stehen. Clustering wird häufig für die Untersuchung von Daten vor der Analyse mit anderen Vorhersagealgorithmen verwendet.

Erstellen eines Clusteringmodells

In Machine Learning Studio (klassisch) können Sie das Clustering entweder mit bezeichneten oder nicht bezeichneten Daten verwenden.

  • Bei Daten ohne Bezeichnung bestimmt der Clusteringalgorithmus, welche Datenpunkte am nächsten beieinander liegen, und erstellt Cluster um einen zentralen Punkt oder Schwerpunkt. Anschließend können Sie die Cluster-ID als temporäre Bezeichnung für die Datengruppe verwenden.

  • Wenn die Daten Bezeichnungen enthalten, können Sie die Bezeichnung verwenden, um die Anzahl der Cluster zu steuern, oder die Bezeichnung als ein weiteres Feature verwenden.

Nachdem Sie den Clusteringalgorithmus konfiguriert haben, trainieren Sie ihn anhand von Daten mithilfe der Module Train Clustering Model oder Sweep Clustering .

Wenn das Modell trainiert wird, verwenden Sie es, um die Clustermitgliedschaft für neue Datenpunkte vorherzusagen. Wenn Sie beispielsweise das Clustering verwendet haben, um Kunden nach Kaufverhalten zu gruppieren, können Sie das Modell verwenden, um das Kaufverhalten neuer Kunden vorherzusagen.

Liste der Module

Die Clusteringkategorie umfasst dieses Modul:

Informationen zur Verwendung eines anderen Clusteringalgorithmus oder zum Erstellen eines benutzerdefinierten Clustermodells mithilfe von R finden Sie in den folgenden Themen:

Beispiele

Beispiele für das Clustering in Aktion finden Sie im Azure KI-Katalog.

Hilfe bei der Auswahl eines Algorithmus finden Sie in den folgenden Artikeln:

Siehe auch