Partager via


Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

Maintenant que vous avez créé le modèle d'exploration de données de prévision, vous pouvez parcourir les résultats en utilisant l'onglet Visionneuse de l'algorithme MTS sous l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données. La Visionneuse de l'algorithme MTS (Microsoft) contient deux onglets : Graphiques et Modèle.

En outre, vous pouvez utiliser la visionneuse générique d'arborescences Microsoft avec tous les modèles. Chaque vue présente une image légèrement différente des informations comprises dans le modèle de série chronologique.

  • Onglet Graphiques

  • Onglet Modèle

  • Visionneuse de contenu générique Microsoft

Onglet Graphiques

L'onglet Graphiques de la Visionneuse de l'algorithme MTS (Microsoft) vous propose une représentation graphique de chacune des séries, notamment les données historiques et les prédictions. Chaque ligne dans le graphique de série chronologique représente une combinaison unique de produit, région et attribut prédictible.

La légende à droite de la visionneuse répertorie la série chronologique disponible, en fonction des sélections de la liste déroulante. Vous pouvez cocher et décocher les cases de la légende pour indiquer la série chronologique à afficher dans le graphique.

Vous pouvez également modifier les options d'affichage, telles que les couleurs utilisées pour chaque série chronologique, ou indiquer si les valeurs sont visibles sur les points du graphique.

Pour sélectionner une série chronologique

  1. Cliquez sur l'onglet Graphiques de l'onglet Visionneuse de modèle d'exploration de données, s'il n'est pas déjà visible.

  2. Cliquez sur la liste déroulante située à droite du graphique, puis activez toutes les cases à cocher. Cliquez sur OK.

    Le graphique doit à présent contenir 24 lignes de série différentes.

  3. Décochez les cases situées à droite du graphique pour masquer temporairement les lignes de toutes les séries basées sur Amount.

    Maintenant, désactivez les cases à cocher en rapport avec les vélos R750 et R250.

    Le graphique contient à présent uniquement les 6 lignes de série suivantes, afin que vous puissiez plus facilement comparer les tendances des vélos M200 et T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Prédiction de la quantité des séries M200 et T1000

Le graphique affiché dans cette visionneuse comprend à la fois des données historiques et des données prédites. Les données prédites sont ombrées pour les distinguer des données historiques. Pour simplifier la comparaison de séries différentes, vous pouvez également modifier les couleurs associées à chaque ligne dans le graphique. Pour plus d'informations, consultez Modifier les couleurs utilisées dans la visionneuse d'exploration de données.

Les lignes de tendance indiquent que le total des ventes enregistré pour toutes les régions est globalement croissant, avec une pointe tous les 12 mois, en décembre. En examinant le graphique, vous pouvez également remarquer que les données pour les vélos T1000 démarrent beaucoup plus tard que celles des séries des autres produits. Ceci est dû au fait qu'il s'agit d'un produit plus récent, mais puisque cette série est basée sur beaucoup moins de données, les prédictions peuvent ne pas être aussi précises.

Par défaut, cinq étapes de prédiction sont affichées pour chaque série chronologique, affichées sous la forme de lignes en pointillés. Vous pouvez modifier cette valeur pour afficher plus ou moins de prédictions. Vous pouvez également afficher graphiquement l'écart type des prédictions en ajoutant des barres d'erreur au graphique.

Pour modifier les options de prédiction et d'affichage dans la vue Graphique

  1. Modifiez progressivement la valeur Étapes de la prévision de 5 à 10, puis revenez à 6.

    Lorsque les données historiques fluctuent beaucoup, ces fluctuations ont tendance à se répéter ou même à s'amplifier lorsque vous augmentez le nombre de prédictions. Vous devrez éventuellement faire des recherches à ce stade, pour comprendre la cause de l'importance de l'augmentation des données historiques, puis choisir d'accepter ces résultats, de rechercher un certain type de correction des données sources, ou d'appliquer un certain type de lissage dans le modèle.

  2. Cochez la case Afficher les écarts.

    Cette option affiche l'estimation de la marge d'erreur pour chaque valeur prédite.

  3. Notez l'échelle de l'axe des X. Les modifications portant sur les données historiques et prédites sont toujours exprimées en pourcentage, mais les valeurs réelles sont ajustées automatiquement pour correspondre à toutes les valeurs présentées sur le graphique. Vous devez donc être vigilant lorsque vous comparez les modèles à ne pas compter uniquement sur les visuels. Pour obtenir la valeur exacte, ou l'augmentation du pourcentage et la valeur des prédictions, placez la souris sur le trait en pointillés ou sur les lignes pleines, ou cliquez sur les lignes pour afficher les valeurs dans Légende d'exploration de données.

Conseil : Si Légende d'exploration de données n'est pas visible, basculez vers la vue Modèle, cliquez avec le bouton droit sur un nœud, puis sélectionnez Afficher la légende.

Une fois ces tendances consultées, vous vous inquiétez du manque de données pour une partie de la série et vous vous demandez si vous pouvez obtenir des prédictions plus fiables en faisant la moyenne des ventes par modèle ou peut-être en calculant la moyenne des ventes par région. Vous allez explorer cette approche lors d'une leçon ultérieure de ce didacticiel.

Retour au début

Onglet Modèle

L'onglet Modèle de la visionneuse de l'algorithme MST (Microsoft) incluse dans le Concepteur d'exploration de données vous permet d'afficher le modèle de prévision sous la forme de graphique d'arborescence.

D'abord, notez qu'en raison de la description faite par vos données de deux mesures différentes (Montant et Quantité) pour les ventes de plusieurs lignes de produits (T1000, etc.) dans trois régions différentes (Europe, Amérique du Nord, et Pacifique), le modèle que vous avez généré contient réellement 24 arborescences différentes, chacune représentant un modèle des modèles de ventes pour une autre combinaison de région, produit, et attribut prédictible.

Vous pouvez choisir la combinaison de ligne de produits, zone et mesures de ventes que vous souhaitez afficher en sélectionnant une série dans la liste déroulante Arborescence sur l'onglet Modèle.

Que pouvez-vous donc apprendre à partir de l'affichage du modèle sous forme d'arborescence ? Par exemple, comparons deux modèles, un qui dispose de plusieurs niveaux dans l'arborescence et un qui dispose d'un nœud unique.

  • Lorsqu'un graphique d'arborescence contient un nœud unique, cela signifie que la tendance trouvée dans le modèle est principalement homogène avec le temps. Vous pouvez utiliser ce nœud unique, intitulé Tout, pour afficher la formule qui décrit la relation entre les variables d'entrée et les résultats.

  • Lorsqu'un graphique d'arbre pour une série chronologique a plusieurs branches, cela signifie que la série chronologique qui a été détectée est trop complexe pour être représentée sous la forme d'une équation unique. À la place, le graphique d'arborescence peut contenir plusieurs branches, chacune intitulée en fonction des conditions qui ont provoqué le fractionnement de l'arborescence. Lorsque l'arborescence se fractionne, chaque branche représente un segment de temps différent, à l'intérieur duquel la tendance peut être décrite comme une équation unique.

    Par exemple, si vous examinez le graphique et constatez une augmentation soudaine du volume des ventes depuis un jour de septembre jusqu'aux fêtes de fin d'année, vous pouvez basculer vers la vue Modèle pour afficher la date exacte à laquelle la tendance a changé. Les branches de l'arborescence qui représentent « avant septembre » et « après septembre » contiendraient des formules différentes : une formule qui décrit mathématiquement les tendances des ventes jusqu'au fractionnement, et une autre formule qui décrit les tendances des ventes pour septembre jusqu'aux fêtes de fin d'année.

Pour explorer l'arbre de décision d'un modèle de série chronologique

  1. Dans la liste Arborescence accessible depuis l'onglet Modèle de la visionneuse, sélectionnez la série T1000 Europe:Amount.

    Cliquez sur le nœud étiqueté Tout.

    Pour un nœud Tout, l'info-bulle qui apparaît inclut des informations telles que le nombre de cas dans la série entière et des équations de série chronologique dérivées de l'analyse des données.

  2. Si la Légende d'exploration de données n'est pas visible, cliquez avec le bouton droit sur le nœud, puis sélectionnez Afficher la légende.

    La Légende d'exploration de données fournit pratiquement les mêmes informations que celles de l'info-bulle. Si l'une de vos variables indépendantes est discrète, vous verrez également un histogramme indiquant la distribution des variables dans le nœud.

  3. Sélectionnez à présent une série chronologique différente à afficher. À l'aide de la liste Arborescence accessible depuis l'onglet Modèle de la visionneuse, sélectionnez la série M200 North America: Amount.

    Le graphique d'arbre contient maintenant un nœud Tout et deux nœuds enfants. En examinant les étiquettes situées sur les nœuds enfants, vous pouvez comprendre le degré de modification de la ligne de tendance.

    Pour chaque nœud enfant, la description de Légende d'exploration de données inclut également le nombre de cas dans chaque branche de l'arborescence.

La liste suivante décrit certaines fonctionnalités supplémentaires de la visionneuse d'arborescence :

  • Vous pouvez modifier la variable représentée dans le graphique à l'aide du contrôle Arrière-plan. Par défaut, les nœuds plus sombres contiennent plus de cas, car la valeur Arrière-plan est définie sur Remplissage. Pour voir juste le nombre de cas présents dans un nœud, placez la souris sur un nœud et lisez l'info-bulle qui apparaît ou cliquez sur le nœud et lisez les nombres présents dans la fenêtre Légende du nœud.

  • La formule de régression du nœud peut également être affichée dans l'info-bulle ou en cliquant sur le nœud. Si vous avez créé un modèle mixte, vous pouvez voir deux formules, une pour ARTXP (dans les nœuds terminaux) et une pour ARIMA (dans le nœud racine de l'arborescence).

  • Les petits losanges sont utilisés dans les nœuds qui représentent des nombres continus. La plage des attributs s'affiche dans la barre sur laquelle le losange est situé. Le losange est centré sur la moyenne du nœud et la largeur du losange représente la variance de l'attribut sur ce nœud.

Retour au début

Visionneuse de l'arborescence de contenu générique (facultative)

En plus de la visionneuse personnalisée pour la série chronologique, Analysis Services fournit la visionneuse d'arborescence de contenu générique Microsoft afin de l'utiliser avec tous les modèles d'exploration de données. Cette visionneuse offre quelques avantages :

  • Visionneuse de l'algorithme MTS : Cette vue fusionne les résultats des deux algorithmes. Bien que vous puissiez afficher chaque série séparément, vous ne pouvez pas déterminer comment les résultats de chaque algorithme ont été combinés. De plus, dans cette vue, les info-bulles et la légende d'exploration de données affichent uniquement les statistiques les plus importantes.

  • Visionneuse de l'arborescence de contenu générique : Vous permet de parcourir et afficher toutes les séries de données utilisées en même temps dans le modèle et, si vous avez créé un modèle mixte, les arborescences ARIMA et ARTXP sont affichées dans le même graphique.

    Vous pouvez utiliser cette visionneuse pour obtenir toutes les statistiques des deux algorithmes, ainsi que les distributions des valeurs.

    Recommandé pour les utilisateurs expérimentés de l'exploration de données qui souhaitent en savoir plus sur les analyses ARIMA et ARTXP.

Pour consulter des détails pour une série de données particulière dans la visionneuse de contenu générique

  1. Sous l'onglet Visionneuse de modèle d'exploration de données, sélectionnez Visionneuse de l'arborescence de contenu générique Microsoft dans la liste déroulante Visionneuse.

  2. Dans le volet Légende du nœud, cliquez sur le nœud de premier niveau (Tout).

  3. Dans le volet Détails du nœud, observez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série, ou combinaison de produit et région, est contenue dans ce nœud. Dans l'exemple AdventureWorks, le nœud de premier niveau correspond à la série M200 Europe.

  4. Dans le volet Légende du nœud, localisez le premier nœud qui possède des nœuds enfants.

    Si un nœud de série possède des enfants, l'arbre figurant sous l'onglet Modèle de la Visionneuse de l'algorithme MTS (Microsoft Time Series) a également une structure de branches.

  5. Développez le nœud et cliquez sur l'un des nœuds enfants.

    La colonne NODE_DESCRIPTION du schéma contient la condition qui a provoqué le fractionnement de l'arborescence.

  6. Dans le volet Légende du nœud, cliquez sur le nœud ARIMA de premier niveau, puis développez le nœud jusqu'à ce que tous les nœuds enfants soient visibles.

  7. Dans le volet Détails du nœud, observez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série chronologique est contenue dans ce nœud. Le nœud de premier niveau dans la section ARIMA doit correspondre au nœud de premier niveau dans la section (Tout). Dans l'exemple AdventureWorks, ce nœud contient l'analyse ARIMA de la série M200 Europe.

Pour plus d'informations, consultez Contenu du modèle d'exploration de données pour les modèles de séries chronologiques (Analysis Services - Exploration de données).

Retour en haut

Tâche suivante de la leçon

Création de prédictions de série chronologique (Didacticiel intermédiaire sur l'exploration de données)

Voir aussi

Référence

Références techniques relatives à l'algorithme MTS (Microsoft Time Series)

Concepts

Exemples de requêtes de modèle de série chronologique