Partager via


Régression de Poisson

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Crée un modèle de régression qui part du principe que les données suivent une distribution de Poisson

catégorie : Machine Learning/initialiser le modèle/la régression

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module régression de poisson dans Machine Learning Studio (classic) pour créer un modèle de régression de poisson.

La régression de poisson est destinée à être utilisée dans les modèles de régression utilisés pour prédire des valeurs numériques, généralement des nombres. Par conséquent, vous devez utiliser ce module pour créer votre modèle de régression uniquement si les valeurs que vous essayez de prédire répondent aux conditions suivantes :

  • La variable de la réponse suit une distribution de Poisson.

  • Les nombres ne peuvent pas être négatifs. La méthode échoue totalement si vous essayez de l'utiliser avec des étiquettes négatives.

  • Une distribution de Poisson étant une distribution discrète, il n'y a donc pas lieu d'utiliser cette méthode avec des nombres non entiers.

Conseil

Si votre cible n'est pas un nombre, la régression de Poisson n'est probablement pas une méthode appropriée. Essayez l’un des autres modules de cette catégorie. pour obtenir de l’aide sur la sélection d’une méthode de régression, consultez l’aide-mémoire d' algorithme Machine Learning.

Une fois que vous avez configuré la méthode de régression, vous devez effectuer l’apprentissage du modèle à l’aide d’un jeu de données contenant des exemples de la valeur que vous souhaitez prédire. Le modèle ainsi formé permet ensuite d’effectuer des prédictions.

En savoir plus sur la régression de Poisson

La régression de Poisson est un type d'analyse de régression généralement utilisée pour les nombres de modèles. Par exemple, la régression de Poisson est utile dans les cas suivants :

  • Modélisation du nombre de rhinites associées aux vols en avion

  • Estimation du nombre d’appels de service d’urgence pendant un événement

  • Projection du nombre de demandes de clients après une promotion

  • Création de tables d'urgence

Étant donné que la variable de réponse a une distribution de Poisson, le modèle fait différentes hypothèses concernant les données et sa distribution de probabilités, par exemple, la régression des moindres carrés. Par conséquent, les modèles de Poisson doivent être interprétés différemment des autres modèles de régression.

Comment configurer la régression de Poisson

  1. Ajoutez le module régression de poisson à votre expérience dans Studio (Classic).

    vous pouvez trouver ce module sous Machine Learning-initialize, dans la catégorie régression .

  2. Ajoutez un jeu de données qui contient les données d’apprentissage du bon type.

    Il est recommandé d'utiliser Normaliser les données pour normaliser le jeu de données d'entrée avant de l'utiliser pour former le régresseur.

  3. Dans le volet Propriétés du module régression de poisson , spécifiez la façon dont vous souhaitez que le modèle soit formé, en définissant l’option créer un mode d’instructeur .

    • Single Parameter (Paramètre unique) : si vous savez comment vous voulez configurer le modèle, fournissez un ensemble spécifique de valeurs en tant qu’arguments.

    • Plage de paramètres. Si vous n’êtes pas sûr des meilleurs paramètres, effectuez un balayage des paramètres à l’aide du module paramétrer les hyperparamètres de modèle . L’instructeur effectue une itération sur plusieurs valeurs que vous spécifiez pour trouver la configuration optimale.

  4. Tolérance d'optimisation : Tapez une valeur qui définit l'intervalle de tolérance lors de l'optimisation. Plus la valeur est faible, plus l'ajustement est lent et précis.

  5. L1 regularization weight (Pondération de régularisation L1) et L2 regularization weight (L2 regularization weight) : Tapez les valeurs à utiliser pour la régularisation L1 et L2. La régularisation ajoute des contraintes à l'algorithme en ce qui concerne les aspects du modèle qui sont indépendants des données d'apprentissage. La régularisation permet également d'éviter le surajustement.

    • La régularisation L1 est utile si l'objectif est de disposer d'un modèle aussi épars que possible.

      La régularisation L1 est effectuée en soustrayant le poids L1 du vecteur de poids de l'expression de perte que l'apprenant essaie de minimiser. La norme L1 est une bonne approximation de la norme L0, qui correspond au nombre de coordonnées différentes de zéro.

    • La régularisation L2 empêche que les coordonnées uniques du vecteur de poids ne croissent trop en grandeur. La régularisation L2 est utile si l'objectif est de disposer d'un modèle avec des poids globaux faibles.

    Dans ce module, vous pouvez appliquer une combinaison de régularisations L1 et L2. En associant les régularisations L1 et L2, vous pouvez imposer une pénalité sur l'amplitude des valeurs de paramètre. L'apprenant essaie de réduire la pénalité, en faisant un compromis avec la réduction de la perte.

    Pour une bonne présentation des régularisations L1 et L2, consultez Régularisations L1 et L2 pour l’apprentissage automatique.

  6. Taille de la mémoire pour L-BFGS : Spécifiez la quantité de mémoire à réserver pour l’ajustement et l’optimisation du modèle.

    L-BFGS est une méthode spécifique pour l’optimisation, basée sur l’algorithme Broyden-Fletcher – Goldfarb – Shanno (BFGS). La méthode utilise une quantité limitée de mémoire (L) pour calculer la direction de l’étape suivante.

    En modifiant ce paramètre, vous pouvez affecter le nombre de positions passées et de gradients pour stocker le calcul de l'étape suivante.

  7. Connectez le jeu de données d’apprentissage et le modèle non formé à l’un des modules d’apprentissage :

    Avertissement

    • Si vous transmettez une plage de paramètres au module Entraîner le modèle, il utilise uniquement la première valeur dans la liste de plages de paramètres.

    • Si vous transmettez un ensemble unique de valeurs de paramètre au module Optimiser les hyperparamètres du modèle, quand il attend une plage de paramètres pour chaque paramètre, il ignore les valeurs et utilise les valeurs par défaut pour l’apprenant.

    • Si vous sélectionnez l’option Plage de paramètres et que vous entrez une valeur unique pour un paramètre, cette valeur unique que vous avez spécifiée est utilisée tout au long du balayage, même si d’autres paramètres changent sur une plage de valeurs.

  8. Exécutez l’expérience pour former le modèle.

Exemples

Pour obtenir des exemples d’utilisation de la régression de poisson dans Machine Learning, consultez la Azure ai Gallery.

Notes techniques

La régression de poisson est utilisée pour modéliser des données de nombre, en supposant que l’étiquette a une distribution de poisson. Par exemple, vous pouvez l’utiliser pour prédire le nombre d’appels à un centre de support technique pour un jour donné.

Pour cet algorithme, on suppose qu’une fonction inconnue, noté Y, a une distribution de poisson. La distribution de poisson est définie comme suit :

Étant donné l’instance x = (x0,..., xD-1), pour chaque k = 0, 1,..., le module calcule la probabilité que la valeur de l’instance est k.

Compte tenu de l’ensemble des exemples d’apprentissage, l’algorithme essaie de trouver les valeurs optimales pour θ0,..., θD-1 en tentant d’optimiser la probabilité du journal des paramètres. La probabilité des paramètres θ0,..., θD-1 est la probabilité que les données d’apprentissage ont été échantillonnées à partir d’une distribution avec ces paramètres.

La probabilité du journal peut être affichée comme logp(y = Yi)

La fonction de prédiction génère la valeur attendue de la distribution de poisson paramétrée, en particulier : fw, b (x) = e [Y | x] = ewTx + b.

Pour plus d’informations, consultez l’entrée relative à la régression de poisson dans Wikipédia.

Paramètres du module

Nom Plage Type Default Description
Tolérance d'optimisation >=double.Epsilon Float 0,0000001 Spécifiez une valeur de tolérance pour la convergence de l'optimisation. Plus la valeur est faible, plus l'ajustement est lent et précis.
Poids de régularisation L1 >= 0,0 Float 1.0 Spécifiez le poids de régularisation L1. Utilisez une valeur différente de zéro pour éviter le surajustement du modèle.
Poids de régularisation L2 >= 0,0 Float 1.0 Spécifiez le poids du régularisation L2. Utilisez une valeur différente de zéro pour éviter le surajustement du modèle.
Taille de la mémoire pour L-BFGS >=1 Integer 20 Indiquer la quantité de mémoire (en Mo) à utiliser pour l'optimiseur L-BFGS. Avec moins de mémoire, l'apprentissage est plus rapide, mais moins précis.
Valeur initiale de nombre aléatoire n'importe laquelle Entier Tapez une valeur pour amorcer le générateur de nombres aléatoires utilisé par le modèle. Laissez vide par défaut.
Autoriser les niveaux catégoriels inconnus n'importe laquelle Boolean true Indiquez si un niveau supplémentaire doit être créé pour chaque colonne catégorielle. Tous les niveaux du jeu de données de test qui ne sont pas disponibles dans le jeu de données d'apprentissage sont mappés à ce niveau supplémentaire.

Sorties

Nom Type Description
Untrained model (Modèle non entraîné) Interface ILearner Modèle de régression non formé

Voir aussi

Régression
Liste alphabétique des modules