Componente: Atribuir Dados a Clusters

Este artigo descreve como utilizar o componente Atribuir Dados a Clusters no estruturador do Azure Machine Learning. O componente gera predições através de um modelo de clustering que foi preparado com o algoritmo de clustering K-means .

O componente Atribuir Dados a Clusters devolve um conjunto de dados que contém as atribuições prováveis para cada novo ponto de dados.

Como utilizar Atribuir Dados a Clusters

  1. No estruturador do Azure Machine Learning, localize um modelo de clustering previamente preparado. Pode criar e preparar um modelo de clustering com um dos seguintes métodos:

    • Configure o algoritmo de clustering K-means com o componente clustering K-Means e prepare o modelo com um conjunto de dados e o componente Train Clustering Model (este artigo).

    • Também pode adicionar um modelo de clustering preparado existente a partir do grupo Modelos Guardados na área de trabalho.

  2. Anexe o modelo preparado à porta de entrada esquerda de Atribuir Dados a Clusters.

  3. Anexe um novo conjunto de dados como entrada.

    Neste conjunto de dados, as etiquetas são opcionais. Geralmente, o clustering é um método de aprendizagem não supervisionado. Não se espera que conheça as categorias com antecedência. No entanto, as colunas de entrada têm de ser as mesmas que as colunas utilizadas na preparação do modelo de clustering ou ocorre um erro.

    Dica

    Para reduzir o número de colunas escritas no estruturador a partir das predições do cluster, utilize Selecionar colunas no conjunto de dados e selecione um subconjunto das colunas.

  4. Deixe a caixa de verificação Procurar acréscimo ou desmarcar apenas o resultado selecionada se pretender que os resultados contenham o conjunto de dados de entrada completo, incluindo uma coluna que apresenta os resultados (atribuições de cluster).

    Se desmarcar esta caixa de verificação, só são devolvidos os resultados. Esta opção pode ser útil quando cria predições como parte de um serviço Web.

  5. Submeta o pipeline.

Resultados

  • Para ver os valores no conjunto de dados, clique com o botão direito do rato no componente e, em seguida, selecione Visualizar. Em alternativa, selecione o componente e mude para o separador Saídas no painel direito, clique no ícone de histograma nas saídas de Porta para visualizar o resultado.