Componente de Regressão Logística multiclasse

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um modelo de regressão logística que pode ser utilizado para prever vários valores.

A classificação através da regressão logística é um método de aprendizagem supervisionado e, por conseguinte, requer um conjunto de dados etiquetado. Pode preparar o modelo ao fornecer o modelo e o conjunto de dados etiquetado como uma entrada para um componente, como Preparar Modelo. Em seguida, o modelo preparado pode ser utilizado para prever valores para novos exemplos de entrada.

O Azure Machine Learning também fornece um componente de Regressão Logística de Duas Classes , adequado para a classificação de variáveis binárias ou dicotómicas.

Acerca da regressão logística multiclasse

A regressão logística é um método bem conhecido nas estatísticas que é utilizado para prever a probabilidade de um resultado e é popular para tarefas de classificação. O algoritmo prevê a probabilidade de ocorrência de um evento ao ajustar os dados a uma função logística.

Na regressão logística multiclasse, o classificador pode ser utilizado para prever vários resultados.

Configurar uma regressão logística multiclasse

  1. Adicione o componente Regressão Logística multiclasse ao pipeline.

  2. Especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único: utilize esta opção se souber como pretende configurar o modelo e fornecer um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: selecione esta opção se não tiver a certeza dos melhores parâmetros e quiser executar uma varrimento de parâmetros. Selecione um intervalo de valores para iterar e os Hiperparâmetros do Modelo de Otimização iteram todas as combinações possíveis das definições que forneceu para determinar os hiperparâmetros que produzem os resultados ideais.

  3. Tolerância à otimização, especifique o valor do limiar para a convergência do otimizador. Se a melhoria entre iterações for inferior ao limiar, o algoritmo para e devolve o modelo atual.

  4. Peso de regularização L1, peso de regularização L2: escreva um valor a utilizar para os parâmetros de regularização L1 e L2. É recomendado um valor diferente de zero para ambos.

    A regularização é um método para impedir o sobreajuste ao penalizar modelos com valores de coeficiente extremos. A regularização funciona ao adicionar a penalização associada aos valores de coeficientes ao erro da hipótese. Um modelo preciso com valores de coeficientes extremos seria penalizado mais, mas um modelo menos preciso com valores mais conservadores seria penalizado menos.

    A regularização L1 e L2 tem efeitos e utilizações diferentes. O L1 pode ser aplicado a modelos dispersos, o que é útil quando se trabalha com dados dimensionais. Por outro lado, a regularização L2 é preferível para dados que não são dispersos. Este algoritmo suporta uma combinação linear de valores de regularização L1 e L2: ou seja, se x = L1 e y = L2, ax + by = c define o intervalo linear dos termos de regularização.

    Foram concebidas diferentes combinações lineares de termos L1 e L2 para modelos de regressão logística, como a regularização da rede elástica.

  5. Semente de número aleatório: escreva um valor inteiro para utilizar como semente para o algoritmo se quiser que os resultados sejam repetíveis em execuções. Caso contrário, um valor de relógio do sistema é utilizado como a semente, que pode produzir resultados ligeiramente diferentes em execuções do mesmo pipeline.

  6. Ligue um conjunto de dados etiquetado e prepare o modelo:

    • Se definir Criar modo de formador como Parâmetro Único, ligue um conjunto de dados etiquetado e o componente Preparar Modelo .

    • Se definir Criar modo de formador como Intervalo de Parâmetros, ligue um conjunto de dados etiquetado e prepare o modelo com Os Hiperparâmetros do Modelo de Otimização.

    Nota

    Se transmitir um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o valor predefinido na lista de parâmetros únicos.

    Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    Se selecionar a opção Intervalo de Parâmetros e introduzir um valor único para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da operação de varrimento, mesmo que outros parâmetros sejam alterados num intervalo de valores.

  7. Submeta o pipeline.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.