Delen via


Clusteringmodules

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel worden de modules in Machine Learning Studio (klassiek) beschreven die ondersteuning bieden voor het maken van clusteringmodellen.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Wat is clustering?

Clustering is in machine learning een methode voor het groeperen van gegevenspunten in vergelijkbare clusters. Dit wordt ook wel segmentatie genoemd.

In de loop van de jaren zijn er veel clusteralgoritmen ontwikkeld. Bijna alle clusteralgoritmen gebruiken de functies van afzonderlijke items om vergelijkbare items te vinden. U kunt bijvoorbeeld clustering toepassen om vergelijkbare personen te vinden op demografische gegevens. U kunt clustering gebruiken met tekstanalyse om zinnen met vergelijkbare onderwerpen of gevoel te groeperen.

Clustering wordt een leertechniek zonder supervisie genoemd, omdat deze kan worden gebruikt in niet-gelabelde gegevens. Clustering is inderdaad een handige eerste stap voor het detecteren van nieuwe patronen en vereist weinig voorkennis over hoe de gegevens kunnen worden gestructureerd of hoe items zijn gerelateerd. Clustering wordt vaak gebruikt voor het verkennen van gegevens vóór analyse met andere meer voorspellende algoritmen.

Een clusteringmodel maken

In Machine Learning Studio (klassiek) kunt u clustering gebruiken met gelabelde of niet-gelabelde gegevens.

  • Bij niet-gelabelde gegevens bepaalt het clusteralgoritme welke gegevenspunten het dichtst bij elkaar liggen en maakt het clusters rond een centraal punt, oftewel het middenpunt. Vervolgens kunt u de cluster-id gebruiken als een tijdelijk label voor de groep gegevens.

  • Als de gegevens labels bevatten, kunt u het label gebruiken om het aantal clusters aan te geven of het label als gewoon een andere functie gebruiken.

Nadat u het clusteringalgoritme hebt geconfigureerd, traint u het op gegevens met behulp van de modules Clusteringmodel trainen of Clustering clusteren opsommen .

Wanneer het model is getraind, gebruikt u het om het clusterlidmaatschap voor nieuwe gegevenspunten te voorspellen. Als u bijvoorbeeld clustering hebt gebruikt om klanten te groeperen op aankoopgedrag, kunt u het model gebruiken om het aankoopgedrag van nieuwe klanten te voorspellen.

Lijst met modules

De clusteringcategorie bevat deze module:

  • K-Means-clustering: hiermee configureert en initialiseert u een K-means-clusteringmodel.

Zie de volgende onderwerpen als u een ander clusteringalgoritme wilt gebruiken of een aangepast clusteringmodel wilt maken met behulp van R:

Voorbeelden

Voor voorbeelden van clustering in actie, zie de Azure AI Gallery.

Zie deze artikelen voor hulp bij het kiezen van een algoritme:

Zie ook