Compartilhar via


Importância do recurso de permuta

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Calcula as pontuações de importância de recurso de permutação de variáveis de recurso considerando um modelo treinado e um conjunto de dados de teste

Categoria: Módulos de Seleção de Recursos

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo descreve como usar o módulo Importância do Recurso de Permutação no Machine Learning Studio (clássico) para calcular um conjunto de pontuações de importância do recurso para seu conjunto de dados. Use essas pontuações para ajudar a determinar os melhores recursos a serem usados em um modelo.

Neste módulo, os valores de recurso são aleatórias aleatoriamente, uma coluna por vez e o desempenho do modelo é medido antes e depois. Você pode escolher uma das métricas padrão fornecidas para medir o desempenho.

As pontuações que o módulo retorna representam a alteração no desempenho de um modelo treinado depois da permutação. Os recursos importantes são geralmente mais sensíveis ao processo de colocar em ordem aleatória e, portanto, resultarão em maiores pontuações de importância.

Este artigo fornece uma boa visão geral da importância do recurso de permutação, sua base teórico e seus aplicativos no aprendizado de máquina: importância do recurso de permutação

Como usar a Importância do Recurso de Permuta

Para gerar um conjunto de pontuações de recursos, é necessário ter um modelo já treinado, bem como um conjunto de dados de teste.

  1. Adicione o módulo Importância do Recurso de Permutação ao seu experimento. Esse módulo pode ser encontrado na categoria Seleção de Recurso.

  2. Conecte um modelo treinado à entrada à esquerda. O modelo deve ser um modelo de regressão ou um modelo de classificação.

  3. Na entrada direita, conecte um conjuntos de dados, preferencialmente um que seja diferente do conjuntos de dados usado para treinar o modelo. Esse conjuntos de dados é usado para pontuação com base no modelo treinado e para avaliar o modelo depois que os valores de recurso foram alterados.

  4. Para Semente aleatória, digite um valor a ser usado como semente para randomização. Se você especificar 0 (o padrão), um número será gerado com base no relógio do sistema.

    Um valor de semente é opcional, mas você deve fornecer um valor se quiser reprodutibilidade entre as executações do mesmo experimento.

  5. Para Métrica para medir o desempenho, selecione uma única métrica a ser usada ao calcular a qualidade do modelo após a permutação.

    Machine Learning Studio (clássico) dá suporte às seguintes métricas, dependendo se você está avaliando um modelo de classificação ou regressão:

    • Classificação

      Precisão, precisão, recall, perda média de log

    • Regressão

      Precisão, Recall, Erro Absoluto Média , Erro Quadrado Da Raiz Média, Erro Absoluto Relativo, Erro Quadrado Relativo, Coeficiente de Determinação

    Para obter uma descrição mais detalhada dessas métricas de avaliação e como elas são calculadas, consulte Avaliar.

  6. Execute o experimento.

  7. O módulo saída de uma lista de colunas de recursos e as pontuações associadas a elas, classificadas na ordem das pontuações, em ordem decrescente.

Exemplos

Consulte estes experimentos de exemplo no Galeria de IA do Azure:

Observações técnicas

Esta seção fornece detalhes de implementação, dicas e respostas para perguntas frequentes.

Como isso se compara a outros métodos de seleção de recursos?

A importância do recurso de permutação funciona alterando aleatoriamente os valores de cada coluna de recurso, uma coluna por vez e avaliando o modelo.

As classificações fornecidas pela importância do recurso de permutação geralmente são diferentes das que você recebe da Seleção de Recursos Baseada em Filtro, que calcula as pontuações antes de um modelo ser criado.

Isso porque a importância do recurso de permutação não mede a associação entre um recurso e um valor de destino, mas captura a influência que cada recurso tem nas previsões do modelo.

Entradas esperadas

Nome Tipo Descrição
Modelo treinado Interface ILearner Um modelo de classificação ou regressão treinado
Dados de teste Tabela de Dados O conjunto de dados de teste para classificar e avaliar um modelo depois da permutação de valores de recurso

Parâmetros do módulo

Nome Tipo Intervalo Opcional Padrão Descrição
Propagação aleatória Inteiro >=0 Obrigatório 0 Valor de propagação do gerador de número aleatório
Métrica para medir o desempenho EvaluationMetricType selecionar na lista Obrigatório Classificação – Precisão Selecione a métrica a ser usada ao avaliar a variabilidade do modelo após as permutações

Saídas

Nome Tipo Descrição
Importância do recurso Tabela de Dados Um conjunto de dados que contém os resultados de importância do recurso, com base na métrica selecionada

Exceções

Exceção Descrição
Erro 0062 Ocorrerá uma exceção durante a tentativa de comparar dois modelos com tipos diferentes de aprendiz.
Erro 0024 Ocorrerá uma exceção se o conjunto de dados não contiver uma coluna de rótulo.
Erro 0105 Gerado quando um arquivo de definição de módulo define um tipo de parâmetro sem suporte
Erro 0021 Ocorrerá uma exceção se o número de linhas em alguns dos conjuntos de dados passados para o módulo for muito pequeno.

Confira também

Seleção de recursos
Seleção de Recursos Baseada em Filtro
Análise de componente principal