Onderdeel: Gegevens toewijzen aan clusters

In dit artikel wordt beschreven hoe u het onderdeel Gegevens toewijzen aan clusters gebruikt in de Azure Machine Learning-ontwerpfunctie. Het onderdeel genereert voorspellingen via een clusteringmodel dat is getraind met het K-means-clustering-algoritme .

Het onderdeel Gegevens toewijzen aan clusters retourneert een gegevensset die de waarschijnlijke toewijzingen voor elk nieuw gegevenspunt bevat.

Gegevens toewijzen aan clusters gebruiken

  1. Zoek in de Azure Machine Learning-ontwerpfunctie een eerder getraind clusteringmodel. U kunt een clusteringmodel maken en trainen met behulp van een van de volgende methoden:

    • Configureer het K-means-clustering-algoritme met behulp van het onderdeel K-Means Clustering en train het model met behulp van een gegevensset en het onderdeel Clusteringmodel trainen (dit artikel).

    • U kunt ook een bestaand getraind clusteringmodel toevoegen vanuit de groep Opgeslagen modellen in uw werkruimte.

  2. Koppel het getrainde model aan de linkerinvoerpoort van Gegevens toewijzen aan clusters.

  3. Voeg een nieuwe gegevensset toe als invoer.

    In deze gegevensset zijn labels optioneel. Over het algemeen is clustering een leermethode zonder supervisie. Van u wordt niet verwacht dat u de categorieën van tevoren kent. De invoerkolommen moeten echter hetzelfde zijn als de kolommen die zijn gebruikt bij het trainen van het clusteringmodel, anders treedt er een fout op.

    Tip

    Als u het aantal kolommen wilt verminderen dat vanuit de clustervoorspellingen naar de ontwerpfunctie wordt geschreven, gebruikt u Kolommen selecteren in de gegevensset en selecteert u een subset van de kolommen.

  4. Laat het selectievakje Alleen resultaten toevoegen of uitschakelen ingeschakeld als u wilt dat de resultaten de volledige invoergegevensset bevatten, inclusief een kolom met de resultaten (clustertoewijzingen).

    Als u dit selectievakje uitschakelt, worden alleen de resultaten geretourneerd. Deze optie kan handig zijn wanneer u voorspellingen maakt als onderdeel van een webservice.

  5. Verzend de pijplijn.

Resultaten

  • Als u de waarden in de gegevensset wilt weergeven, klikt u met de rechtermuisknop op het onderdeel en selecteert u Vervolgens Visualiseren. Of Selecteer het onderdeel en ga naar het tabblad Uitvoer in het rechterdeelvenster, klik op het histogrampictogram in de Poortuitvoer om het resultaat te visualiseren.