Componente de Regressão Logística Multiclasse

2024-09-01

Este artigo descreve um componente no designer do Azure Machine Learning.

Use este componente para criar um modelo de regressão logística que possa ser usado para prever vários valores.

A classificação por regressão logística é um método de aprendizagem supervisionada e, portanto, requer um conjunto de dados rotulado. Você treina o modelo fornecendo o modelo e o conjunto de dados rotulado como uma entrada para um componente como Modelo de Trem. O modelo treinado pode então ser usado para prever valores para novos exemplos de entrada.

O Azure Machine Learning também fornece um componente de Regressão Logística de Duas Classes , que é adequado para classificação de variáveis binárias ou dicotômicas.

Sobre a regressão logística multiclasse

A regressão logística é um método bem conhecido em estatística que é usado para prever a probabilidade de um resultado, e é popular para tarefas de classificação. O algoritmo prevê a probabilidade de ocorrência de um evento ajustando os dados a uma função logística.

Na regressão logística multiclasse, o classificador pode ser usado para prever múltiplos resultados.

Configurar uma regressão logística multiclasse

Adicione o componente Regressão Logística Multiclasse ao pipeline.
Especifique como deseja que o modelo seja treinado, definindo a opção Criar modo de treinador.
- Parâmetro único: use esta opção se souber como deseja configurar o modelo e forneça um conjunto específico de valores como argumentos.
- Intervalo de parâmetros: selecione esta opção se não tiver certeza dos melhores parâmetros e quiser executar uma varredura de parâmetros. Selecione um intervalo de valores para iterar e o Tune Model Hyperparameters itera sobre todas as combinações possíveis das configurações fornecidas para determinar os hiperparâmetros que produzem os resultados ideais.
Tolerância de otimização, especifique o valor limite para convergência do otimizador. Se a melhoria entre iterações for menor que o limite, o algoritmo para e retorna o modelo atual.
Peso de regularização L1, peso de regularização L2: Digite um valor a ser usado para os parâmetros de regularização L1 e L2. Um valor diferente de zero é recomendado para ambos.

A regularização é um método para evitar o overfitting, penalizando modelos com valores de coeficiente extremos. A regularização funciona adicionando a penalidade que está associada aos valores dos coeficientes ao erro da hipótese. Um modelo preciso com valores de coeficiente extremos seria mais penalizado, mas um modelo menos preciso com valores mais conservadores seria menos penalizado.

A regularização de L1 e L2 tem efeitos e usos diferentes. L1 pode ser aplicado a modelos esparsos, o que é útil quando se trabalha com dados de alta dimensão. Em contrapartida, a regularização L2 é preferível para dados que não são escassos. Este algoritmo suporta uma combinação linear de valores de regularização L1 e L2: isto é, se x = L1 e y = L2, ax + by = c define a extensão linear dos termos de regularização.

Diferentes combinações lineares de termos L1 e L2 têm sido concebidas para modelos de regressão logística, como regularização de redes elásticas.
Semente de número aleatório: digite um valor inteiro para usar como semente para o algoritmo se quiser que os resultados sejam repetíveis em execuções. Caso contrário, um valor de relógio do sistema é usado como a semente, o que pode produzir resultados ligeiramente diferentes em execuções do mesmo pipeline.
Conecte um conjunto de dados rotulado e treine o modelo:
- Se você definir Create trainer mode como Single Parameter, conecte um conjunto de dados marcado e o componente Train Model .
- Se você definir Criar modo de treinamento como Intervalo de parâmetros, conecte um conjunto de dados marcado e treine o modelo usando Ajustar hiperparâmetros do modelo.
Nota

Se você passar um intervalo de parâmetros para Train Model, ele usará apenas o valor padrão na lista de parâmetros únicos.

Se você passar um único conjunto de valores de parâmetro para o componente Ajustar Hiperparâmetros do Modelo, quando ele espera um intervalo de configurações para cada parâmetro, ele ignora os valores e usa os valores padrão para o aluno.

Se você selecionar a opção Intervalo de parâmetros e inserir um único valor para qualquer parâmetro, esse único valor especificado será usado durante toda a varredura, mesmo que outros parâmetros sejam alterados em um intervalo de valores.
Envie o pipeline.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.

Partilhar via

Componente de Regressão Logística Multiclasse

Sobre a regressão logística multiclasse

Configurar uma regressão logística multiclasse

Próximos passos

Comentários

Recursos adicionais