Módulos de agrupación en clústeres

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describen los módulos de Machine Learning Studio (clásico) que admiten la creación de modelos de agrupación en clústeres.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

¿Qué es la agrupación en clústeres?

La agrupación en clústeres, en aprendizaje automático, es un método de agrupación de puntos de datos en clústeres similares. También se denomina segmentación.

A lo largo de los años, se han desarrollado muchos algoritmos de agrupación en clústeres. Casi todos los algoritmos de agrupación en clústeres usan las características de elementos individuales para buscar elementos similares. Por ejemplo, puede aplicar la agrupación en clústeres para buscar personas similares por datos demográficos. Puede usar la agrupación en clústeres con análisis de texto para agrupar oraciones con temas o opiniones similares.

La agrupación en clústeres se denomina técnica de aprendizaje no supervisado porque se puede usar en datos sin etiquetar. De hecho, la agrupación en clústeres es un primer paso útil para detectar nuevos patrones y requiere poco conocimiento previo sobre cómo se podrían estructurar los datos o cómo se relacionan los elementos. La agrupación en clústeres se usa a menudo para la exploración de datos antes del análisis con otros algoritmos más predictivos.

Creación de un modelo de agrupación en clústeres

En Machine Learning Studio (clásico), puede usar la agrupación en clústeres con datos etiquetados o sin etiquetar.

  • En los datos sin etiquetar, el algoritmo de agrupación en clústeres determina qué puntos de datos están más cerca juntos y crea clústeres alrededor de un punto central o centroide. A continuación, puede usar el identificador de clúster como etiqueta temporal para el grupo de datos.

  • Si los datos tienen etiquetas, puede usar la etiqueta para impulsar el número de clústeres o usar la etiqueta como otra característica.

Después de configurar el algoritmo de agrupación en clústeres, entrena con datos mediante los módulos Entrenar modelo de agrupación en clústeres o Barrido de clústeres .

Cuando se entrena el modelo, úselo para predecir la pertenencia al clúster para nuevos puntos de datos. Por ejemplo, si ha usado la agrupación en clústeres para agrupar clientes por comportamiento de compra, puede usar el modelo para predecir el comportamiento de compra de los nuevos clientes.

Lista de módulos

La categoría de agrupación en clústeres incluye este módulo:

Para usar un algoritmo de agrupación en clústeres diferente o crear un modelo de agrupación en clústeres personalizado mediante R, consulte estos temas:

Ejemplos

Para obtener ejemplos de agrupación en clústeres en acción, consulte el Azure AI Gallery.

Consulte estos artículos para obtener ayuda para elegir un algoritmo:

Consulte también