Partilhar via


Selecionar Transformação de Colunas

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Cria uma transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados dados

Categoria: Transformação de Dados / Manipulação

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Este artigo descreve como utilizar o módulo Select Columns Transform em Machine Learning Studio (clássico). O objetivo do módulo Select Columns Transform é garantir que um conjunto previsível e consistente de colunas seja sempre utilizado em operações de aprendizagem automática a jusante.

Este módulo é particularmente útil para tarefas como a pontuação, que requerem colunas específicas. As alterações nas colunas disponíveis podem quebrar a experiência ou alterar os resultados.

Utilize a Curva de Colunas Select para criar e guardar um conjunto de colunas. Em seguida, utilize o módulo De Transformação De Aplicar para aplicar essas seleções em novos dados.

Como utilizar a seleção de colunas transformam

Este cenário pressupõe que pretende utilizar a seleção de recursos para gerar um conjunto dinâmico de colunas que serão usadas para treinar um modelo. Para garantir que as seleções de colunas são as mesmas para o processo de pontuação, utiliza o módulo Select Columns Transform para capturar as seleções de colunas e aplicá-las em outros lugares da experiência.

  1. Adicione um conjunto de dados de entrada à sua experiência no Studio (clássico).

  2. Adicione uma instância da Seleção de Recursos Baseados em Filtro.

  3. Ligação os módulos e configurar o módulo de seleção de funcionalidades para encontrar automaticamente alguns dos melhores recursos no conjunto de dados de entrada.

  4. Adicione uma instância do Modelo de Comboio e use a saída da Seleção de Recursos Baseados em Filtros como entrada para o treino.

    Importante

    Uma vez que a importância da característica é decidida com base nos valores da coluna, não é possível saber com antecedência quais as colunas que podem estar disponíveis para entrada no Modelo de Comboio.

  5. Agora, anexe uma instância do módulo Select Columns Transform .

    Isto gera uma seleção de colunas como uma transformação que pode ser guardada ou aplicada a outros conjuntos de dados. Este passo garante que as colunas identificadas pela seleção de recursos são guardadas para reutilização por outros módulos.

  6. Adicione o módulo 'Modelo de Pontuação '.

    Não ligue o conjunto de dados de entrada.

    Em vez disso, adicione o módulo De Transformação De Aplicar e ligue a saída da transformação da seleção de recursos.

    Importante

    Não pode esperar aplicar a Seleção de Recursos Baseados em Filtros no conjunto de dados de pontuação e obter os mesmos resultados. Uma vez que a seleção de recursos é baseada em valores, pode escolher um conjunto diferente de colunas, o que faria com que a operação de pontuação falhasse.

  7. Execute a experimentação.

Este processo de poupança e, em seguida, aplicação de uma seleção de colunas garante que o mesmo esquema de dados está disponível para treino e pontuação.

Exemplos

Por exemplo, como utilizar este módulo, consulte a Galeria Azure AI:

Entradas esperadas

Nome Tipo Description
Conjunto de dados com colunas desejadas Tabela de Dados Conjunto de dados que contém conjunto de colunas desejado

Saídas

Nome Tipo Description
Transformação da seleção de colunas Interface ITransform Transformação que seleciona o mesmo subconjunto de colunas que no conjunto de dados dados.

Exceções

Exceção Description
Erro 0003 A exceção ocorre se uma ou mais entradas forem nulas ou vazias.

Ver também

Manipulação
Selecionar Colunas no Conjunto de Dados