Regressão de Poisson

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um modelo de regressão Poisson num pipeline. A regressão de Poisson destina-se a prever valores numéricos, normalmente conta. Por conseguinte, deve utilizar este componente para criar o modelo de regressão apenas se os valores que está a tentar prever se ajustarem às seguintes condições:

  • A variável de resposta tem uma distribuição Poisson.

  • As contagens não podem ser negativas. O método falhará totalmente se tentar utilizá-lo com etiquetas negativas.

  • Uma distribuição Poisson é uma distribuição discreta; portanto, não é significativo utilizar este método com números não inteiros.

Dica

Se o seu destino não for uma contagem, a regressão de Poisson provavelmente não é um método adequado. Experimente outros componentes de regressão no estruturador.

Depois de configurar o método de regressão, tem de preparar o modelo com um conjunto de dados que contenha exemplos do valor que pretende prever. Em seguida, o modelo preparado pode ser utilizado para fazer predições.

Mais informações sobre a regressão de Poisson

A regressão de Poisson é um tipo especial de análise de regressão que é normalmente utilizada para contagens de modelos. Por exemplo, a regressão de Poisson seria útil nestes cenários:

  • Modelar o número de constipações associadas a voos de avião

  • Estimar o número de chamadas do serviço de emergência durante um evento

  • Projetar o número de inquéritos dos clientes subsequentes a uma promoção

  • Criar tabelas de contingência

Uma vez que a variável de resposta tem uma distribuição Poisson, o modelo faz suposições diferentes sobre os dados e a sua distribuição de probabilidade do que, digamos, a regressão de menos quadrados. Por conseguinte, os modelos Poisson devem ser interpretados de forma diferente dos outros modelos de regressão.

Como configurar a Regressão de Poisson

  1. Adicione o componente Poisson Regression ao pipeline no estruturador. Pode encontrar este componente em Algoritmos de Machine Learning, na categoria Regressão .

  2. Adicione um conjunto de dados que contenha dados de preparação do tipo correto.

    Recomendamos que utilize Normalizar Dados para normalizar o conjunto de dados de entrada antes de o utilizar para preparar o regressor.

  3. No painel direito do componente Poisson Regression , especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único: se souber como pretende configurar o modelo, forneça um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: se não tiver a certeza dos melhores parâmetros, faça uma análise de parâmetros com o componente Otimizar Hiperparâmetros do Modelo . O formador itera vários valores que especificar para encontrar a configuração ideal.

  4. Tolerância de otimização: escreva um valor que defina o intervalo de tolerância durante a otimização. Quanto mais baixo for o valor, mais lento e preciso será o ajuste.

  5. Peso da regularização L1 e peso da regularização L2: escreva os valores a utilizar para regularização L1 e L2. A regularização adiciona restrições ao algoritmo relativamente a aspetos do modelo que são independentes dos dados de preparação. A regularização é geralmente utilizada para evitar o sobreajuste.

    • A regularização L1 é útil se o objetivo for ter um modelo tão disperso quanto possível.

      A regularização L1 é feita ao subtrair o peso L1 do vetor de peso da expressão de perda que o formando está a tentar minimizar. A norma L1 é uma boa aproximação à norma L0, que é o número de coordenadas não zero.

    • A regularização L2 impede que qualquer coordenada única no vetor de peso cresça demasiado em magnitude. A regularização L2 é útil se o objetivo for ter um modelo com pesos gerais pequenos.

    Neste componente, pode aplicar uma combinação de regularizações L1 e L2. Ao combinar a regularização L1 e L2, pode impor uma penalização à magnitude dos valores dos parâmetros. O formando tenta minimizar a penalidade, numa troca com a minimização da perda.

    Para uma boa discussão sobre a regularização L1 e L2, veja Regularização L1 e L2 para Machine Learning.

  6. Tamanho da memória para L-BFGS: especifique a quantidade de memória a reservar para ajuste e otimização de modelos.

    O L-BFGS é um método específico de otimização, baseado no algoritmo Broyden-Fletcher–Goldfarb-Shanno (BFGS). O método utiliza uma quantidade limitada de memória (L) para calcular a direção do próximo passo.

    Ao alterar este parâmetro, pode afetar o número de posições e gradações anteriores armazenadas para computação do próximo passo.

  7. Ligue o conjunto de dados de preparação e o modelo não preparado a um dos componentes de preparação:

    Aviso

    • Se passar um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o primeiro valor na lista de intervalo de parâmetros.

    • Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    • Se selecionar a opção Intervalo de Parâmetros e introduzir um único valor para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da pesquisa, mesmo que outros parâmetros sejam alterados num intervalo de valores.

  8. Submeta o pipeline.

Resultados

Após a conclusão da preparação:

  • Para guardar um instantâneo do modelo preparado, selecione o componente de preparação e, em seguida, mude para o separador Saídas+registos no painel direito. Clique no ícone Registar conjunto de dados. Pode encontrar o modelo guardado como um componente na árvore de componentes.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.