Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
L’algorithme De régression linéaire Microsoft est une variante de l’algorithme Microsoft Decision Trees qui vous aide à calculer une relation linéaire entre une variable dépendante et indépendante, puis à utiliser cette relation pour la prédiction.
La relation prend la forme d’une équation pour une ligne qui représente le mieux une série de données. Par exemple, la ligne du diagramme suivant est la meilleure représentation linéaire possible des données.
Chaque point de données du diagramme comporte une erreur associée à sa distance par rapport à la ligne de régression. Les coefficients a et b dans l’équation de régression ajustent l’angle et l’emplacement de la ligne de régression. Vous pouvez obtenir l’équation de régression en ajustant a et b jusqu’à ce que la somme des erreurs associées à tous les points atteigne son minimum.
Il existe d’autres types de régression qui utilisent plusieurs variables, ainsi que des méthodes non linéaires de régression. Toutefois, la régression linéaire est une méthode utile et connue pour modéliser une réponse à un changement dans un facteur sous-jacent.
Exemple :
Vous pouvez utiliser la régression linéaire pour déterminer une relation entre deux colonnes continues. Par exemple, vous pouvez utiliser la régression linéaire pour calculer une courbe de tendance à partir de données de fabrication ou de vente. Vous pouvez également utiliser la régression linéaire comme précurseur du développement de modèles d’exploration de données plus complexes pour évaluer les relations entre les colonnes de données.
Bien qu’il existe de nombreuses façons de calculer la régression linéaire qui ne nécessitent pas d’outils d’exploration de données, l’avantage d’utiliser l’algorithme De régression linéaire Microsoft pour cette tâche est que toutes les relations possibles entre les variables sont automatiquement calculées et testées. Vous n’avez pas besoin de sélectionner une méthode de calcul, telle que la résolution pour les moindres carrés. Toutefois, la régression linéaire peut sursimplifier les relations dans les scénarios où plusieurs facteurs affectent le résultat.
Fonctionnement de l’algorithme
L’algorithme De régression linéaire Microsoft est une variante de l’algorithme Microsoft Decision Trees. Lorsque vous sélectionnez l’algorithme Microsoft Linear Regression, un cas particulier de l’algorithme Microsoft Decision Trees est appelé, avec des paramètres qui limitent le comportement de l’algorithme et nécessitent certains types de données d’entrée. De plus, dans un modèle de régression linéaire, l’ensemble du jeu de données est utilisé pour l’informatique des relations dans la passe initiale, tandis qu’un modèle d’arbre de décision standard fractionne les données à plusieurs reprises en sous-ensembles ou arborescences plus petits.
Données requises pour les modèles de régression linéaire
Lorsque vous préparez des données à utiliser dans un modèle de régression linéaire, vous devez comprendre les exigences de l’algorithme particulier. Cela inclut la quantité de données nécessaires et la façon dont les données sont utilisées. Les conditions requises pour ce type de modèle sont les suivantes :
Une seule colonne clé Chaque modèle doit contenir une colonne numérique ou texte qui identifie de manière unique chaque enregistrement. Les clés composées ne sont pas autorisées.
Une colonne prédictible Nécessite au moins une colonne prévisible. Vous pouvez inclure plusieurs attributs prédictibles dans un modèle, mais les attributs prédictibles doivent être des types de données numériques continus. Vous ne pouvez pas utiliser un type de données datetime comme attribut prédictible même si le stockage natif des données est numérique.
Colonnes d’entrée Les colonnes d’entrée doivent contenir des données numériques continues et être affectées au type de données approprié.
Pour plus d’informations, consultez la section Configuration requise de Microsoft Linear Regression Algorithm Technical Reference.
Affichage d’un modèle de régression linéaire
Pour explorer le modèle, vous utilisez microsoft Tree Viewer. La structure d’arborescence d’un modèle de régression linéaire est très simple, avec toutes les informations sur l’équation de régression contenue dans un seul nœud. Pour plus d’informations, consultez Parcourir un modèle à l’aide du Microsoft Tree Viewer.
Si vous souhaitez en savoir plus sur l’équation, vous pouvez également afficher les coefficients et d’autres détails à l’aide de l’arborescence de contenu générique Microsoft.
Pour un modèle de régression linéaire, le contenu du modèle inclut des métadonnées, la formule de régression et des statistiques sur la distribution des valeurs d’entrée. Pour plus d’informations, consultez Contenu du modèle d’exploration de données pour les modèles de régression linéaire (Analysis Services - Exploration de données).
Création de prédictions
Une fois le modèle traité, les résultats sont stockés sous la forme d’un ensemble de statistiques avec la formule de régression linéaire, que vous pouvez utiliser pour calculer les tendances futures. Pour obtenir des exemples de requêtes à utiliser avec un modèle de régression linéaire, consultez Exemples de requêtes de modèle de régression linéaire.
Pour obtenir des informations générales sur la création de requêtes sur des modèles d’exploration de données, consultez Requêtes d’exploration de données.
En plus de créer un modèle de régression linéaire en sélectionnant l’algorithme De régression linéaire Microsoft, si l’attribut prédictible est un type de données numérique continu, vous pouvez créer un modèle d’arbre de décision qui contient des régressions. Dans ce cas, l’algorithme fractionne les données lorsqu’il trouve des points de séparation appropriés, mais pour certaines régions de données, crée une formule de régression à la place. Pour plus d’informations sur les arborescences de régression dans un modèle d’arbre de décision, consultez Contenu du modèle d’exploration de données pour les modèles d’arbre de décision (Analysis Services - Exploration de données).
Remarques
Ne prend pas en charge l’utilisation de PMML (Predictive Model Markup Language) pour la création de modèles d'exploration de données.
Ne prend pas en charge la création de dimensions d’exploration de données.
Prend en charge l’exploration détaillée.
Prend en charge l’utilisation de modèles d’exploration de données OLAP.
Voir aussi
Algorithmes d’exploration de données (Analysis Services - Exploration de données)Référence technique de l'algorithme de régression linéaire de MicrosoftExemples de requêtes de modèles de régression linéaireContenu des modèles d’exploration de données pour les modèles de régression linéaire (Analysis Services - Exploration de données)