Delen via


Gegevens aan cluster toewijzen

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Wijst gegevens toe aan clusters met behulp van een bestaand getraind clusteringmodel

Categorie: Score

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Gegevens toewijzen aan clusters in Machine Learning Studio (klassiek) gebruikt om voorspellingen te genereren met behulp van een clusteringmodel dat is getraind met behulp van het K-Means-clusteringalgoritme.

De module retourneert een gegevensset die de waarschijnlijke toewijzingen voor elk nieuw gegevenspunt bevat. Er wordt ook een PCA-grafiek (Principal Component Analysis) gemaakt om u te helpen de dimensionaliteit van de clusters te visualiseren.

Waarschuwing

Deze module vervangt de module Toewijzen aan clusters (afgeschaft), die alleen beschikbaar is voor ondersteuning van oudere experimenten.

Gegevens toewijzen aan clusters gebruiken

  1. Zoek Machine Learning Studio (klassiek) een eerder getraind clusteringmodel. U kunt een clusteringmodel maken en trainen met behulp van een van deze methoden:

    U kunt ook een bestaand getraind clusteringmodel toevoegen vanuit de groep Opgeslagen modellen in uw werkruimte.

  2. Koppel het getrainde model aan de linkerinvoerpoort van Gegevens toewijzen aan clusters.

  3. Voeg een nieuwe gegevensset toe als invoer. In deze gegevensset zijn labels optioneel. Over het algemeen is clustering een leermethode zonder supermomenten, dus het is niet verwacht dat u van tevoren categorieën kent.

    De invoerkolommen moeten echter hetzelfde zijn als de kolommen die zijn gebruikt bij het trainen van het clusteringmodel, anders treedt er een fout op.

    Tip

    Als u het aantal kolommen van clustervoorspellingen wilt verminderen, gebruikt u Kolommen in gegevensset selecteren en selecteert u een subset van de kolommen.

  4. Laat de optie Controleren op Toevoegen of Selectievakje voor Alleen resultaat uit als u wilt dat de resultaten de volledige invoerset bevatten, samen met een kolom die de resultaten aangeeft (clustertoewijzingen).

    Als u deze optie deselecteert, krijgt u alleen de resultaten terug. Dit kan handig zijn bij het maken van voorspellingen als onderdeel van een webservice.

  5. Voer het experiment uit.

Resultaten

De module Gegevens toewijzen aan clusters retourneert twee soorten resultaten in de uitvoer van de resultatengegevensset :

  • Als u de scheiding van clusters in het model wilt zien, klikt u op de uitvoer van de module en selecteert u Visualize

    Met deze opdracht wordt een PCA-grafiek (Principal Component Analysis) weergegeven die de verzameling waarden in elk cluster toekent aan twee onderdeelassen.

    • De eerste onderdeelas is de gecombineerde set functies die de meeste afwijking in het model vast legt. Deze wordt uitgezet op de x-as (Principal Component 1).
    • De volgende onderdeelas vertegenwoordigt een gecombineerde set functies die een zijhoek heeft van het eerste onderdeel en die de volgende meeste informatie aan de grafiek toevoegt. Deze wordt uitgezet op de y-as (Principal Component 2).

    In de grafiek ziet u de scheiding tussen de clusters en hoe de clusters worden verdeeld over de assen die de belangrijkste onderdelen vertegenwoordigen.

  • Als u de tabel met resultaten voor elk geval in de invoergegevens wilt weergeven, koppelt u de module Converteren naar gegevensset en visualiseert u de resultaten in Studio (klassiek).

    Deze gegevensset bevat de clustertoewijzingen voor elk geval en een metrische afstandsmetrische gegevens die u een indicatie geven van hoe dicht dit specifieke geval bij het midden van het cluster ligt.

    Naam van uitvoerkolom Description
    Toewijzingen Een op 0 gebaseerde index die aangeeft aan welk cluster het gegevenspunt is toegewezen.
    DistancesToClusterCenter no. n Voor elk gegevenspunt geeft deze waarde de afstand aan van het gegevenspunt naar het midden van het toegewezen cluster en de afstand tot andere clusters.

    De metrische gegevens die worden gebruikt om de afstand te berekenen, worden bepaald wanneer u het K-means-clusteringmodel configureert.

Verwachte invoer

Naam Type Description
Getraind model ICluster-interface Getraind clusteringmodel
Gegevensset Gegevenstabel Invoergegevensbron

Moduleparameters

Naam Type Bereik Optioneel Standaard Beschrijving
Alleen resultaat of app-resultaat Vereist TRUE Geef aan of de uitvoerset zowel de invoerset als de resultaten moet bevatten, of alleen de resultaten
Parameterparameterparametermodus opgeven Opruimmethoden Lijst:Volledig raster| Willekeurige opsruiming Vereist Willekeurige opsruiming Hele raster op parameterruimte doorzoeken of opsampen met behulp van een beperkt aantal voorbeeld runs

Uitvoerwaarden

Naam Type Description
Gegevensset met resultaten Gegevenstabel Invoergegevensset toegevoegd aan gegevenskolom met alleen toewijzingen of toewijzingenkolom

Uitzonderingen

Uitzondering Description
Fout 0003 Uitzondering treedt op als een of meer invoer null of leeg zijn.

Zie ook

K-means-clustering
Score