Modules de clustering

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
En savoir plus sur Azure Machine Learning.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article décrit les modules de Machine Learning Studio (classic) qui prennent en charge la création de modèles de clustering.

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Qu’est-ce que le clustering ?

Le clustering, en Machine Learning, est une méthode de regroupement des points de données en clusters similaires. Elle est également appelée segmentation.

Au fil des années, de nombreux algorithmes de clustering ont été développés. Presque tous les algorithmes de clustering utilisent les fonctionnalités des éléments individuels pour rechercher des éléments similaires. Par exemple, vous pouvez appliquer le clustering pour rechercher des personnes similaires par démographiques. Vous pouvez utiliser le clustering avec l’analyse de texte pour regrouper des phrases avec des sujets ou des sentiments similaires.

Le clustering est une technique d’apprentissage non supervisée, car elle peut être utilisée dans des données sans étiquette. En effet, le clustering est une première étape utile pour découvrir de nouveaux modèles et nécessite peu de connaissances préalables sur la façon dont les données peuvent être structurées ou sur la façon dont les éléments sont liés. Le clustering est souvent utilisé pour l’exploration des données avant l’analyse avec d’autres algorithmes prédictifs.

Comment créer un modèle de clustering

dans Machine Learning Studio (classic), vous pouvez utiliser le clustering avec des données étiquetées ou sans étiquette.

Dans les données sans étiquette, l’algorithme de clustering détermine les points de données les plus proches et crée des clusters autour d’un point central, ou centre de gravité. Vous pouvez ensuite utiliser l’ID de cluster comme étiquette temporaire pour le groupe de données.
Si les données ont des étiquettes, vous pouvez utiliser l’étiquette pour déterminer le nombre de clusters ou utiliser l’étiquette comme une autre fonctionnalité.

Une fois que vous avez configuré l’algorithme de clustering, vous l’exécutez sur des données à l’aide du modèle train clustering ou des modules de clustering de balayage .

Lorsque le modèle est formé, utilisez-le pour prévoir l’appartenance au cluster pour les nouveaux points de données. Par exemple, si vous avez utilisé le clustering pour regrouper des clients en achetant un comportement, vous pouvez utiliser le modèle pour prédire le comportement d’achat des nouveaux clients.

Liste des modules

La catégorie clustering comprend ce module :

Clustering k-signifiant: configure et initialise un modèle de clustering k-signifiant.

Pour utiliser un autre algorithme de clustering ou créer un modèle de clustering personnalisé à l’aide de R, consultez les rubriques suivantes :

Exemples

Pour obtenir des exemples de clustering en action, consultez le Azure ai Gallery.

Consultez les articles suivants pour vous aider à choisir un algorithme :

aide-mémoire sur les algorithmes d’apprentissage automatique pour Machine Learning Studio (classic)

Fournit un graphique de décision graphique pour vous guider tout au long du processus de sélection.
comment choisir des algorithmes de Machine Learning pour le clustering, la classification ou la régression

Explique plus en détail les différents types d’algorithmes de Machine Learning et la manière dont ils sont utilisés.

Voir aussi

Last updated on 2019-05-06