Componente: Assign Data to Cluster

En este artículo se describe cómo usar el módulo Assign Data to Cluster (Asignar datos a clústeres) en el diseñador de Azure Machine Learning. El componente genera predicciones mediante un modelo de agrupación en clústeres que se ha entrenado con el algoritmo de agrupación en clústeres K-means.

El componente Assign Data to Cluster (Asignar datos a clústeres) devuelve un conjunto de datos que contiene las asignaciones probables para cada punto de datos nuevo.

Cómo utilizar Asignación de datos a clústeres

  1. En el diseñador de Azure Machine Learning, busque un modelo de agrupación en clústeres entrenado previamente. Puede crear y entrenar un modelo de agrupación en clústeres mediante cualquiera de los métodos siguientes:

    • Configure el algoritmo de agrupación en clústeres K-means mediante el componente Agrupación en clústeres K-means y, para entrenar el modelo, utilice un conjunto de datos y el componente Train Clustering Model (Entrenar el modelo de agrupación en clústeres) (en este artículo).

    • También puede agregar un modelo de agrupación en clústeres entrenado existente desde el grupo Modelos guardados en el área de trabajo.

  2. Adjunte el modelo entrenado al puerto de entrada izquierdo de Asignación de datos a clústeres.

  3. Adjunte un conjunto de datos nuevo como entrada.

    En este conjunto de datos, las etiquetas son opcionales. Por lo general, la agrupación en clústeres es un método de aprendizaje no supervisado. No se espera que conozca de antemano las categorías. Sin embargo, las columnas de entrada deben ser iguales que las columnas que se usan para entrenar el modelo de agrupación en clústeres; de lo contrario, se produce un error.

    Sugerencia

    Para reducir el número de columnas que se escriben en el diseñador desde las predicciones de clúster, use Seleccionar columnas del conjunto de datos y seleccione un subconjunto de columnas.

  4. Deje la casilla Marcar para anexar o desmarcar solo para obtener el resultado activada si quiere que los resultados contengan el conjunto de datos de entrada completo, incluida una columna en que se muestran los resultados (asignaciones de clúster).

    Si desactiva esta casilla, solo se devuelven los resultados. Esta opción puede ser útil al crear predicciones como parte de un servicio web.

  5. Envíe la canalización.

Results

  • Para ver los valores del conjunto de datos, haga clic con el botón derecho en el componente y seleccione Visualizar. O bien, seleccione el componente y cambie a la pestaña Resultados del panel derecho, haga clic en el icono de histograma de Salidas de puerto para visualizar el resultado.