Gegevens aan cluster toewijzen

Artikel
05/06/2019

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
Meer informatie over Azure Machine Learning.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Wijst gegevens toe aan clusters met behulp van een bestaand getraind clusteringmodel

Categorie: Score

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Gegevens toewijzen aan clusters in Machine Learning Studio (klassiek) gebruikt om voorspellingen te genereren met behulp van een clusteringmodel dat is getraind met behulp van het K-Means-clusteringalgoritme.

De module retourneert een gegevensset die de waarschijnlijke toewijzingen voor elk nieuw gegevenspunt bevat. Er wordt ook een PCA-grafiek (Principal Component Analysis) gemaakt om u te helpen de dimensionaliteit van de clusters te visualiseren.

Waarschuwing

Deze module vervangt de module Toewijzen aan clusters (afgeschaft), die alleen beschikbaar is voor ondersteuning van oudere experimenten.

Gegevens toewijzen aan clusters gebruiken

Zoek Machine Learning Studio (klassiek) een eerder getraind clusteringmodel. U kunt een clusteringmodel maken en trainen met behulp van een van deze methoden:
- Configureer het K-means-algoritme met behulp van de K-Means Clustering-module en train het model vervolgens met behulp van een gegevensset en de module Clusteringmodel trainen.
- Configureer een reeks opties voor het K-means-algoritme met behulp van K-Means-clustering en train het model vervolgens met behulp van de clusteringmodule Opsommen .
U kunt ook een bestaand getraind clusteringmodel toevoegen vanuit de groep Opgeslagen modellen in uw werkruimte.
Koppel het getrainde model aan de linkerinvoerpoort van Gegevens toewijzen aan clusters.
Voeg een nieuwe gegevensset toe als invoer. In deze gegevensset zijn labels optioneel. Over het algemeen is clustering een leermethode zonder supermomenten, dus het is niet verwacht dat u van tevoren categorieën kent.

De invoerkolommen moeten echter hetzelfde zijn als de kolommen die zijn gebruikt bij het trainen van het clusteringmodel, anders treedt er een fout op.

Tip

Als u het aantal kolommen van clustervoorspellingen wilt verminderen, gebruikt u Kolommen in gegevensset selecteren en selecteert u een subset van de kolommen.
Laat de optie Controleren op Toevoegen of Selectievakje voor Alleen resultaat uit als u wilt dat de resultaten de volledige invoerset bevatten, samen met een kolom die de resultaten aangeeft (clustertoewijzingen).

Als u deze optie deselecteert, krijgt u alleen de resultaten terug. Dit kan handig zijn bij het maken van voorspellingen als onderdeel van een webservice.
Voer het experiment uit.

Resultaten

De module Gegevens toewijzen aan clusters retourneert twee soorten resultaten in de uitvoer van de resultatengegevensset :

Als u de scheiding van clusters in het model wilt zien, klikt u op de uitvoer van de module en selecteert u Visualize

Met deze opdracht wordt een PCA-grafiek (Principal Component Analysis) weergegeven die de verzameling waarden in elk cluster toekent aan twee onderdeelassen.
- De eerste onderdeelas is de gecombineerde set functies die de meeste afwijking in het model vast legt. Deze wordt uitgezet op de x-as (Principal Component 1).
- De volgende onderdeelas vertegenwoordigt een gecombineerde set functies die een zijhoek heeft van het eerste onderdeel en die de volgende meeste informatie aan de grafiek toevoegt. Deze wordt uitgezet op de y-as (Principal Component 2).
In de grafiek ziet u de scheiding tussen de clusters en hoe de clusters worden verdeeld over de assen die de belangrijkste onderdelen vertegenwoordigen.

Als u de tabel met resultaten voor elk geval in de invoergegevens wilt weergeven, koppelt u de module Converteren naar gegevensset en visualiseert u de resultaten in Studio (klassiek).

Deze gegevensset bevat de clustertoewijzingen voor elk geval en een metrische afstandsmetrische gegevens die u een indicatie geven van hoe dicht dit specifieke geval bij het midden van het cluster ligt.

Naam van uitvoerkolom	Description
Toewijzingen	Een op 0 gebaseerde index die aangeeft aan welk cluster het gegevenspunt is toegewezen.
DistancesToClusterCenter no. n	Voor elk gegevenspunt geeft deze waarde de afstand aan van het gegevenspunt naar het midden van het toegewezen cluster en de afstand tot andere clusters. De metrische gegevens die worden gebruikt om de afstand te berekenen, worden bepaald wanneer u het K-means-clusteringmodel configureert.

Verwachte invoer

Naam	Type	Description
Getraind model	ICluster-interface	Getraind clusteringmodel
Gegevensset	Gegevenstabel	Invoergegevensbron

Moduleparameters

Naam	Type	Bereik	Optioneel	Standaard	Beschrijving
Alleen resultaat of app-resultaat			Vereist	TRUE	Geef aan of de uitvoerset zowel de invoerset als de resultaten moet bevatten, of alleen de resultaten
Parameterparameterparametermodus opgeven	Opruimmethoden	Lijst:Volledig raster\| Willekeurige opsruiming	Vereist	Willekeurige opsruiming	Hele raster op parameterruimte doorzoeken of opsampen met behulp van een beperkt aantal voorbeeld runs

Uitvoerwaarden

Naam	Type	Description
Gegevensset met resultaten	Gegevenstabel	Invoergegevensset toegevoegd aan gegevenskolom met alleen toewijzingen of toewijzingenkolom

Uitzonderingen

Uitzondering	Description
Fout 0003	Uitzondering treedt op als een of meer invoer null of leeg zijn.

Zie ook

K-means-clustering
Score

Delen via