Train Clustering Model (Preparar Modelo de Clustering)

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Treina um modelo de agrupamento e atribui dados do conjunto de formação a clusters

Categoria: Machine Learning / Comboio

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo Train Clustering Model em Machine Learning Studio (clássico), para treinar um modelo de agrupamento.

O módulo requer um modelo de agrupamento não treinado que já configurado utilizando o módulo de Clustering K-Means , e treina o modelo usando um conjunto de dados rotulado ou não rotulado. O módulo cria tanto um modelo treinado que pode usar para previsão, como um conjunto de atribuições de cluster para cada caso nos dados de treino.

Nota

Um modelo de clustering não pode ser treinado usando o módulo Train Model , que é o módulo genérico para criar modelos de aprendizagem automática. Isto porque o Train Model funciona apenas com algoritmos de aprendizagem supervisionados. Os k-meios e outros algoritmos de agrupamento permitem uma aprendizagem não supervisionada, o que significa que o algoritmo pode aprender com dados não rotulados.

Como usar o modelo de clustering do comboio

  1. Adicione o módulo Modelo de Clustering de Comboio à sua experiência no Studio (clássico). Pode encontrar o módulo em Machine Learning Módulos, na categoria Comboio.

  2. Adicione o módulo de clustering K-Means , ou outro módulo personalizado que cria um modelo de agrupamento compatível, e desa estalem os parâmetros do modelo de agrupamento.

  3. Anexar um conjunto de dados de treino à entrada direita do Modelo de Agrupamento de Comboios.

  4. No Conjunto de Colunas, selecione as colunas do conjunto de dados para utilizar em aglomerados de construção. Certifique-se de selecionar colunas que fazem boas funcionalidades: por exemplo, evite usar IDs ou outras colunas com valores únicos, ou colunas que tenham todos os mesmos valores.

    Se houver uma etiqueta disponível, pode usá-la como recurso ou deixá-la de fora.

  5. Selecione a opção, Verifique se o Apêndice ou Desmarcar apenas o resultado, se pretender desemparar os dados de formação juntamente com a nova etiqueta do cluster.

    Se desmarcar esta opção, apenas as atribuições de cluster são de saída.

  6. Executar a experiência, ou clicar no módulo Modelo de Agrupamento de Comboios e selecione Run Selected.

Resultados

Após o treino ter terminado:

  • Para ver o cluster e a sua separação num gráfico, clique com o botão direito na saída do conjunto de dados de Resultados e selecione Visualize.

    O gráfico representa os principais componentes do cluster, em vez dos valores reais. Consulte a Análise principal de Componentes para obter mais informações.

  • Para visualizar os valores no conjunto de dados, adicione uma instância do módulo Convertendo-o ao Conjunto de Dados e conecte-o à saída do conjunto de dados de resultados . Executar o módulo Converter para Conjunto de Dados para obter uma cópia dos dados que pode ver ou descarregar.

  • Para guardar o modelo treinado para posterior reutilização, clique com o botão direito no módulo, selecione Modelo Treinado e clique em Save As Trained Model.

  • Para gerar pontuações a partir do modelo, utilize atribuir dados aos clusters.

Exemplos

Para um exemplo de como o agrupamento é usado na aprendizagem automática, consulte a Galeria Azure AI:

Entradas esperadas

Nome Tipo Description
Modelo destreinado Interface ICluster Modelo de agrupamento não treinado
Conjunto de dados Tabela de Dados Fonte de dados de entrada

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Description
Conjunto de colunas qualquer Seleção de Colunas Padrão de seleção de colunas
Verifique se o Apêndice ou o Uncheck apenas para resultados qualquer Booleano true Se o conjunto de dados de saída deve conter conjunto de dados de entrada anexado pela coluna de atribuições (Verificado) ou apenas coluna de atribuições (não verificada)

Saídas

Nome Tipo Description
Modelo treinado Interface ICluster Modelo de agrupamento treinado
Conjunto de dados de resultados Tabela de Dados Conjunto de dados de entrada anexado por coluna de dados de atribuições ou coluna de atribuições

Exceções

Exceção Description
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Lista de Módulos A-Z
Preparar
Assign Data to Clusters (Atribuir Dados a Clusters)
Clustering K-Means