Partilhar via


Escolha parâmetros para otimizar seus algoritmos no Machine Learning Studio (clássico)

APLICA-SE A: Aplica-se a.Machine Learning Studio (clássico) Não se aplica a.Azure Machine Learning

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Este tópico descreve como escolher o conjunto de hiperparâmetros correto para um algoritmo no Machine Learning Studio (clássico). A maioria dos algoritmos de aprendizado de máquina tem parâmetros para definir. Ao treinar um modelo, você precisa fornecer valores para esses parâmetros. A eficácia do modelo treinado depende dos parâmetros do modelo escolhidos. O processo de encontrar o conjunto ideal de parâmetros é conhecido como seleção de modelo.

Existem várias maneiras de fazer a seleção de modelos. No aprendizado de máquina, a validação cruzada é um dos métodos mais usados para a seleção de modelos, e é o mecanismo de seleção de modelo padrão no Machine Learning Studio (clássico). Como o Machine Learning Studio (clássico) suporta R e Python, você sempre pode implementar seus próprios mecanismos de seleção de modelo usando R ou Python.

Há quatro etapas no processo de encontrar o melhor conjunto de parâmetros:

  1. Defina o espaço do parâmetro: Para o algoritmo, primeiro decida os valores exatos dos parâmetros que deseja considerar.
  2. Definir as configurações de validação cruzada: decida como escolher dobras de validação cruzada para o conjunto de dados.
  3. Definir a métrica: decida qual métrica usar para determinar o melhor conjunto de parâmetros, como precisão, erro quadrático médio raiz, precisão, recall ou pontuação f.
  4. Treinar, avaliar e comparar: Para cada combinação exclusiva dos valores dos parâmetros, a validação cruzada é realizada por e com base na métrica de erro que você define. Após avaliação e comparação, você pode escolher o modelo com melhor desempenho.

A imagem a seguir ilustra como isso pode ser alcançado no Machine Learning Studio (clássico).

Encontre o melhor conjunto de parâmetros

Definir o espaço de parâmetros

Você pode definir o conjunto de parâmetros na etapa de inicialização do modelo. O painel de parâmetros de todos os algoritmos de aprendizado de máquina tem dois modos de treinamento: Parâmetro único e Intervalo de parâmetros. Escolha o modo Intervalo de parâmetros. No modo Intervalo de parâmetros, você pode inserir vários valores para cada parâmetro. Você pode inserir valores separados por vírgulas na caixa de texto.

Árvore de decisão impulsionada de duas classes, parâmetro único

Como alternativa, você pode definir os pontos máximos e mínimos da grade e o número total de pontos a serem gerados com o Use Range Builder. Por padrão, os valores dos parâmetros são gerados em uma escala linear. Mas se a Escala de Log estiver marcada, os valores serão gerados na escala de log (ou seja, a proporção dos pontos adjacentes é constante em vez de sua diferença). Para parâmetros inteiros, você pode definir um intervalo usando um hífen. Por exemplo, "1-10" significa que todos os inteiros entre 1 e 10 (ambos inclusive) formam o conjunto de parâmetros. Um modo misto também é suportado. Por exemplo, o conjunto de parâmetros "1-10, 20, 50" incluiria inteiros 1-10, 20 e 50.

Árvore de decisão impulsionada de duas classes, intervalo de parâmetros

Definir dobras de validação cruzada

O módulo Partição e Amostra pode ser usado para atribuir aleatoriamente dobras aos dados. Na configuração de exemplo a seguir para o módulo, definimos cinco dobras e atribuímos aleatoriamente um número de dobra às instâncias de amostra.

Partição e amostra

Definir a métrica

O módulo Tune Model Hyperparameters fornece suporte para escolher empiricamente o melhor conjunto de parâmetros para um determinado algoritmo e conjunto de dados. Além de outras informações sobre o treinamento do modelo, o painel Propriedades deste módulo inclui a métrica para determinar o melhor conjunto de parâmetros. Ele tem duas caixas de listagem suspensas diferentes para algoritmos de classificação e regressão, respectivamente. Se o algoritmo em consideração for um algoritmo de classificação, a métrica de regressão será ignorada e vice-versa. Neste exemplo específico, a métrica é Precisão.

Parâmetros de varredura

Treinar, avaliar e comparar

O mesmo módulo Tune Model Hyperparameters treina todos os modelos que correspondem ao conjunto de parâmetros, avalia várias métricas e, em seguida, cria o modelo mais bem treinado com base na métrica escolhida. Este módulo tem duas entradas obrigatórias:

  • O aluno sem formação
  • O conjunto de dados

O módulo também tem uma entrada de conjunto de dados opcional. Conecte o conjunto de dados com informações de dobra à entrada obrigatória do conjunto de dados. Se o conjunto de dados não receber nenhuma informação de dobra, uma validação cruzada de 10 vezes será executada automaticamente por padrão. Se a atribuição de dobra não for feita e um conjunto de dados de validação for fornecido na porta opcional do conjunto de dados, um modo train-test será escolhido e o primeiro conjunto de dados será usado para treinar o modelo para cada combinação de parâmetros.

Classificador de árvore de decisão impulsionado

O modelo é então avaliado no conjunto de dados de validação. A porta de saída esquerda do módulo mostra diferentes métricas como funções de valores de parâmetros. A porta de saída correta fornece o modelo treinado que corresponde ao modelo com melhor desempenho de acordo com a métrica escolhida (Precisão neste caso).

Conjunto de dados de validação

Você pode ver os parâmetros exatos escolhidos visualizando a porta de saída correta. Esse modelo pode ser usado na pontuação de um conjunto de testes ou em um serviço Web operacionalizado depois de salvar como um modelo treinado.