Onderdeel: Gegevens toewijzen aan clusters
In dit artikel wordt beschreven hoe u het onderdeel Gegevens toewijzen aan clusters gebruikt in azure Machine Learning Designer. Het onderdeel genereert voorspellingen via een clusteringmodel dat is getraind met het K-means-clustering-algoritme .
Het onderdeel Gegevens toewijzen aan clusters retourneert een gegevensset die de waarschijnlijke toewijzingen voor elk nieuw gegevenspunt bevat.
Gegevens toewijzen aan clusters gebruiken
Zoek in de Azure Machine Learning-ontwerpfunctie een eerder getraind clusteringmodel. U kunt een clusteringmodel maken en trainen met behulp van een van de volgende methoden:
Configureer het K-means-clustering-algoritme met behulp van het K-Means Clustering-onderdeel en train het model met behulp van een gegevensset en het onderdeel Clusteringmodel trainen (dit artikel).
U kunt ook een bestaand getraind clusteringmodel toevoegen vanuit de groep Opgeslagen modellen in uw werkruimte.
Koppel het getrainde model aan de linkerinvoerpoort van Toewijzingsgegevens aan clusters.
Voeg een nieuwe gegevensset als invoer toe.
In deze gegevensset zijn labels optioneel. Over het algemeen is clustering een leermethode zonder supervisie. U verwacht niet van tevoren de categorieën te kennen. De invoerkolommen moeten echter hetzelfde zijn als de kolommen die zijn gebruikt bij het trainen van het clusteringmodel, of er treedt een fout op.
Tip
Als u het aantal kolommen wilt beperken dat vanuit de clustervoorspellingen naar de ontwerpfunctie wordt geschreven, gebruikt u Kolommen selecteren in de gegevensset en selecteert u een subset van de kolommen.
Laat het selectievakje Controleren op toevoegen of uitschakelen voor alleen resultaat ingeschakeld als u wilt dat de resultaten de volledige invoergegevensset bevatten, inclusief een kolom waarin de resultaten worden weergegeven (clustertoewijzingen).
Als u dit selectievakje uitschakelt, worden alleen de resultaten geretourneerd. Deze optie kan handig zijn wanneer u voorspellingen maakt als onderdeel van een webservice.
Verzend de pijplijn.
Resultaten
- Als u de waarden in de gegevensset wilt weergeven, klikt u met de rechtermuisknop op het onderdeel en selecteert u Visualiseren. Of selecteer het onderdeel en ga naar het tabblad Uitvoer in het rechterdeelvenster, klik op het histogrampictogram in de poortuitvoer om het resultaat te visualiseren.