Importância do recurso de permuta

Artigo
05/06/2019

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
Saiba mais sobre o Azure Machine Learning.

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Calcula as pontuações de importância de recurso de permutação de variáveis de recurso considerando um modelo treinado e um conjunto de dados de teste

Categoria: Módulos de Seleção de Recursos

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo descreve como usar o módulo Importância do Recurso de Permutação no Machine Learning Studio (clássico) para calcular um conjunto de pontuações de importância do recurso para seu conjunto de dados. Use essas pontuações para ajudar a determinar os melhores recursos a serem usados em um modelo.

Neste módulo, os valores de recurso são aleatórias aleatoriamente, uma coluna por vez e o desempenho do modelo é medido antes e depois. Você pode escolher uma das métricas padrão fornecidas para medir o desempenho.

As pontuações que o módulo retorna representam a alteração no desempenho de um modelo treinado depois da permutação. Os recursos importantes são geralmente mais sensíveis ao processo de colocar em ordem aleatória e, portanto, resultarão em maiores pontuações de importância.

Este artigo fornece uma boa visão geral da importância do recurso de permutação, sua base teórico e seus aplicativos no aprendizado de máquina: importância do recurso de permutação

Como usar a Importância do Recurso de Permuta

Para gerar um conjunto de pontuações de recursos, é necessário ter um modelo já treinado, bem como um conjunto de dados de teste.

Adicione o módulo Importância do Recurso de Permutação ao seu experimento. Esse módulo pode ser encontrado na categoria Seleção de Recurso.
Conecte um modelo treinado à entrada à esquerda. O modelo deve ser um modelo de regressão ou um modelo de classificação.
Na entrada direita, conecte um conjuntos de dados, preferencialmente um que seja diferente do conjuntos de dados usado para treinar o modelo. Esse conjuntos de dados é usado para pontuação com base no modelo treinado e para avaliar o modelo depois que os valores de recurso foram alterados.
Para Semente aleatória, digite um valor a ser usado como semente para randomização. Se você especificar 0 (o padrão), um número será gerado com base no relógio do sistema.

Um valor de semente é opcional, mas você deve fornecer um valor se quiser reprodutibilidade entre as executações do mesmo experimento.
Para Métrica para medir o desempenho, selecione uma única métrica a ser usada ao calcular a qualidade do modelo após a permutação.

Machine Learning Studio (clássico) dá suporte às seguintes métricas, dependendo se você está avaliando um modelo de classificação ou regressão:
- Classificação
  
  Precisão, precisão, recall, perda média de log
- Regressão
  
  Precisão, Recall, Erro Absoluto Média , Erro Quadrado Da Raiz Média, Erro Absoluto Relativo, Erro Quadrado Relativo, Coeficiente de Determinação
Para obter uma descrição mais detalhada dessas métricas de avaliação e como elas são calculadas, consulte Avaliar.
Execute o experimento.
O módulo saída de uma lista de colunas de recursos e as pontuações associadas a elas, classificadas na ordem das pontuações, em ordem decrescente.

Exemplos

Consulte estes experimentos de exemplo no Galeria de IA do Azure:

Importância do recurso de permutação: demonstra como usar este módulo para classificar variáveis de recurso de um conjuntos de dados em ordem de pontuações de importância de permutação.
Usando o módulo Importância do Recurso de Permutação: ilustra o uso deste módulo em um serviço Web.

Observações técnicas

Esta seção fornece detalhes de implementação, dicas e respostas para perguntas frequentes.

Como isso se compara a outros métodos de seleção de recursos?

A importância do recurso de permutação funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna por vez e avaliando o modelo.

As classificações fornecidas pela importância do recurso de permutação geralmente são diferentes das que você recebe da Seleção de Recursos Baseada em Filtro, que calcula as pontuações antes de um modelo ser criado.

Isso porque a importância do recurso de permutação não mede a associação entre um recurso e um valor de destino, mas captura a influência que cada recurso tem nas previsões do modelo.

Entradas esperadas

Nome	Tipo	Descrição
Modelo treinado	Interface ILearner	Um modelo de classificação ou regressão treinado
Dados de teste	Tabela de Dados	O conjunto de dados de teste para classificar e avaliar um modelo depois da permutação de valores de recurso

Parâmetros do módulo

Nome	Tipo	Intervalo	Opcional	Padrão	Descrição
Propagação aleatória	Inteiro	>=0	Obrigatório	0	Valor de propagação do gerador de número aleatório
Métrica para medir o desempenho	EvaluationMetricType	selecionar na lista	Obrigatório	Classificação – Precisão	Selecione a métrica a ser usada ao avaliar a variabilidade do modelo após as permutações

Saídas

Nome	Tipo	Descrição
Importância do recurso	Tabela de Dados	Um conjunto de dados que contém os resultados de importância do recurso, com base na métrica selecionada

Exceções

Exceção	Descrição
Erro 0062	Ocorrerá uma exceção durante a tentativa de comparar dois modelos com tipos diferentes de aprendiz.
Erro 0024	Ocorrerá uma exceção se o conjunto de dados não contiver uma coluna de rótulo.
Erro 0105	Gerado quando um arquivo de definição de módulo define um tipo de parâmetro sem suporte
Erro 0021	Ocorrerá uma exceção se o número de linhas em alguns dos conjuntos de dados passados para o módulo for muito pequeno.

Confira também

Seleção de recursos
Seleção de Recursos Baseada em Filtro
Análise de componente principal

Compartilhar via