Partager via


Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

Maintenant que vous avez créé le modèle d’exploration de données de prévision, vous pouvez explorer les résultats à l’aide de l’onglet Visionneuse de modèle d’exploration de données de Designer d’exploration de données. Microsoft Time Series Viewer contient deux onglets : Graphiques et Modèle.

En outre, vous pouvez utiliser la visionneuse générique d'arborescences Microsoft avec tous les modèles. Chaque vue présente une image légèrement différente des informations comprises dans le modèle de série chronologique.

Onglet Graphiques

L’onglet Graphiques de la Visionneuse de séries chronologiques Microsoft affiche graphiquement chacune des séries, y compris les données historiques et les prédictions. Chaque ligne dans le graphique de série chronologique représente une combinaison unique de produit, région et attribut prédictible.

La légende à droite de la visionneuse répertorie la série chronologique disponible, en fonction des sélections de la liste déroulante. Vous pouvez cocher et décocher les cases de la légende pour indiquer la série chronologique à afficher dans le graphique.

Vous pouvez également modifier les options d'affichage, telles que les couleurs utilisées pour chaque série chronologique, ou indiquer si les valeurs sont visibles sur les points du graphique.

Pour sélectionner une série chronologique

  1. Cliquez sur l’onglet Graphiques de l’onglet Visionneuse de modèle d’exploration de données, s’il n’est pas visible.

  2. Cliquez sur la liste déroulante située à droite du graphique, puis activez toutes les cases à cocher. Cliquez sur OK.

    Le graphique doit à présent contenir 24 lignes de série différentes.

  3. Dans les zones de case activée à droite du graphique, désactivez les zones pour masquer temporairement les lignes de toutes les séries basées sur Le montant.

    Maintenant, désactivez les cases à cocher en rapport avec les vélos R750 et R250.

    Le graphique contient à présent uniquement les 6 lignes de série suivantes, afin que vous puissiez plus facilement comparer les tendances des vélos M200 et T1000.

    • M200 Europe : Quantité

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Série prédisant la quantité M200 et T1000

Le graphique affiché dans cette visionneuse comprend à la fois des données historiques et des données prédites. Les données prédites sont ombrées pour les distinguer des données historiques. Pour simplifier la comparaison de séries différentes, vous pouvez également modifier les couleurs associées à chaque ligne dans le graphique. Pour plus d’informations, consultez Modifier les couleurs utilisées dans la visionneuse d’exploration de données.

Les lignes de tendance indiquent que le total des ventes enregistré pour toutes les régions est globalement croissant, avec une pointe tous les 12 mois, en décembre. En examinant le graphique, vous pouvez également remarquer que les données pour les vélos T1000 démarrent beaucoup plus tard que celles des séries des autres produits. Ceci est dû au fait qu'il s'agit d'un produit plus récent, mais puisque cette série est basée sur beaucoup moins de données, les prédictions peuvent ne pas être aussi précises.

Par défaut, cinq étapes de prédiction sont affichées pour chaque série chronologique, affichées sous la forme de lignes en pointillés. Vous pouvez modifier cette valeur pour afficher plus ou moins de prédictions. Vous pouvez également afficher graphiquement l'écart type des prédictions en ajoutant des barres d'erreur au graphique.

Pour modifier les options de prédiction et d'affichage dans la vue Graphique

  1. Essayez de modifier progressivement la valeur des étapes de prédiction , en l’augmentant de 5 à 10, puis à 6.

    Lorsque les données historiques fluctuent beaucoup, ces fluctuations ont tendance à se répéter ou même à s'amplifier lorsque vous augmentez le nombre de prédictions. Vous devrez éventuellement faire des recherches à ce stade, pour comprendre la cause de l'importance de l'augmentation des données historiques, puis choisir d'accepter ces résultats, de rechercher un certain type de correction des données sources, ou d'appliquer un certain type de lissage dans le modèle.

  2. Sélectionnez la zone Afficher les écarts case activée.

    Cette option affiche l'estimation de la marge d'erreur pour chaque valeur prédite.

  3. Notez l'échelle de l'axe des X. Les modifications portant sur les données historiques et prédites sont toujours exprimées en pourcentage, mais les valeurs réelles sont ajustées automatiquement pour correspondre à toutes les valeurs présentées sur le graphique. Vous devez donc être vigilant lorsque vous comparez les modèles à ne pas compter uniquement sur les visuels. Pour obtenir la valeur exacte, ou le pourcentage d’augmentation et la valeur des prédictions, placez la souris sur la ligne en pointillés ou les lignes pleines, ou cliquez sur les lignes pour afficher les valeurs dans la légende d’exploration de données.

    Conseil : Si la légende d’exploration de données n’est pas visible, basculez vers la vue Modèle , cliquez avec le bouton droit sur un nœud, puis sélectionnez Afficher la légende.

Une fois ces tendances consultées, vous vous inquiétez du manque de données pour une partie de la série et vous vous demandez si vous pouvez obtenir des prédictions plus fiables en faisant la moyenne des ventes par modèle ou peut-être en calculant la moyenne des ventes par région. Vous allez explorer cette approche lors d'une leçon ultérieure de ce didacticiel.

Retour en haut

Onglet Modèle

L’onglet Modèle de la visionneuse de séries chronologiques Microsoft dans l’exploration de données Designer vous permet d’afficher le modèle de prévision sous la forme d’un arborescence.

D'abord, notez qu'en raison de la description faite par vos données de deux mesures différentes (Montant et Quantité) pour les ventes de plusieurs lignes de produits (T1000, etc.) dans trois régions différentes (Europe, Amérique du Nord, et Pacifique), le modèle que vous avez généré contient réellement 24 arborescences différentes, chacune représentant un modèle des modèles de ventes pour une autre combinaison de région, produit, et attribut prédictible.

Vous pouvez choisir la combinaison de lignes de produits, de régions et de métriques des ventes que vous souhaitez afficher en sélectionnant une série dans la liste déroulante Arborescence de l’onglet Modèle .

Que pouvez-vous donc apprendre à partir de l'affichage du modèle sous forme d'arborescence ? À titre d’exemple, comparons deux modèles, l’un qui a plusieurs niveaux dans l’arborescence et l’autre qui a un seul nœud.

  • Lorsqu'un graphique d'arborescence contient un nœud unique, cela signifie que la tendance trouvée dans le modèle est principalement homogène avec le temps. Vous pouvez utiliser ce nœud unique, intitulé All, pour afficher la formule qui décrit la relation entre les variables d’entrée et le résultat.

  • Lorsqu'un graphique d'arbre pour une série chronologique a plusieurs branches, cela signifie que la série chronologique qui a été détectée est trop complexe pour être représentée sous la forme d'une équation unique. Au lieu de cela, l’arborescence peut contenir plusieurs branches, chaque branche étiquetée avec les conditions qui ont provoqué la division de l’arborescence. Lorsque l'arborescence se fractionne, chaque branche représente un segment de temps différent, à l'intérieur duquel la tendance peut être décrite comme une équation unique.

    Par exemple, si vous regardez le graphique et que vous voyez une augmentation soudaine du volume des ventes à partir de septembre et se prolongeant pendant les vacances de fin d’année, vous pouvez basculer vers la vue Modèle pour voir la date exacte où la tendance a changé. Les branches de l’arbre qui représentent « avant septembre » et « après septembre » contiennent différentes formules : une formule qui décrit mathématiquement les tendances des ventes jusqu’au fractionnement, et une autre formule qui décrit les tendances des ventes de septembre jusqu’aux vacances de fin d’année.

Pour explorer l'arbre de décision d'un modèle de série chronologique

  1. Dans la liste Arborescence de l’onglet Modèle de la visionneuse, sélectionnez la série T1000 Europe : Montant .

    Cliquez sur le nœud intitulé Tout.

    Pour un nœud Tout , l’info-bulle qui s’affiche inclut des informations telles que le nombre de cas dans la série entière et les équations de série chronologique dérivées de l’analyse des données.

  2. Si la légende d’exploration de données n’est pas visible, cliquez avec le bouton droit sur le nœud et sélectionnez Afficher la légende.

    La légende d’exploration de données fournit les mêmes informations que celles contenues dans l’info-bulle. Si l'une de vos variables indépendantes est discrète, vous verrez également un histogramme indiquant la distribution des variables dans le nœud.

  3. Sélectionnez à présent une série chronologique différente à afficher. À l’aide de la liste Arborescence sous l’onglet Modèle de la visionneuse, sélectionnez la série M200 Amérique du Nord : Montant.

    L’arborescence contient désormais un nœud Tout et deux nœuds enfants. En examinant les étiquettes situées sur les nœuds enfants, vous pouvez comprendre le degré de modification de la ligne de tendance.

    Pour chaque nœud enfant, la description de la légende d’exploration de données inclut également le nombre de cas dans chaque branche de l’arborescence.

La liste suivante décrit certaines fonctionnalités supplémentaires de la visionneuse d'arborescence :

  • Vous pouvez modifier la variable représentée dans le graphique à l’aide du contrôle Arrière-plan . Par défaut, les nœuds qui sont plus sombres contiennent davantage de cas, car la valeur d’Arrière-plan est définie sur Population. Pour voir le nombre de cas dans un nœud, mettez en pause la souris sur un nœud et affichez l’info-bulle qui s’affiche, ou cliquez sur le nœud et affichez les nombres dans la fenêtre Légende du nœud .

  • La formule de régression du nœud peut également être affichée dans l'info-bulle ou en cliquant sur le nœud. Si vous avez créé un modèle mixte, vous pouvez voir deux formules, une pour ARTXP (dans les nœuds terminaux) et une pour ARIMA (dans le nœud racine de l'arborescence).

  • Les petits losanges sont utilisés dans les nœuds qui représentent des nombres continus. La plage des attributs s'affiche dans la barre sur laquelle le losange est situé. Le losange est centré sur la moyenne du nœud et la largeur du losange représente la variance de l'attribut sur ce nœud.

Retour en haut

Visionneuse de l'arborescence de contenu générique (facultative)

En plus de la visionneuse personnalisée pour les séries chronologiques, Analysis Services fournit la visionneuse d’arborescence de contenu MicrosoftGeneric à utiliser avec tous les modèles d’exploration de données. Cette visionneuse offre quelques avantages :

  • Visionneuse de séries chronologiques Microsoft : cette vue fusionne les résultats des deux algorithmes. Bien que vous puissiez afficher chaque série séparément, vous ne pouvez pas déterminer comment les résultats de chaque algorithme ont été combinés. De plus, dans cette vue, les info-bulles et la légende d'exploration de données affichent uniquement les statistiques les plus importantes.

  • Visionneuse d’arborescence de contenu générique : vous permet de parcourir et d’afficher toutes les séries de données utilisées dans le modèle à la fois, et si vous avez créé un modèle mixte, les arborescences ARIMA et ARTXP sont affichées dans le même graphique.

    Vous pouvez utiliser cette visionneuse pour obtenir toutes les statistiques des deux algorithmes, ainsi que les distributions des valeurs.

    Recommandé pour les utilisateurs expérimentés de l'exploration de données qui souhaitent en savoir plus sur les analyses ARIMA et ARTXP.

Pour consulter des détails pour une série de données particulière dans la visionneuse de contenu générique

  1. Sous l’onglet Visionneuse de modèle d’exploration de données, sélectionnez Microsoft Generic Content Tree Viewer dans la liste déroulante Visionneuse .

  2. Dans le volet Légende du nœud , cliquez sur le nœud le plus haut (Tous).

  3. Dans le volet Détails du nœud , affichez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série, ou combinaison de produit et région, est contenue dans ce nœud. Dans l'exemple AdventureWorks, le nœud de premier niveau correspond à la série M200 Europe.

  4. Dans le volet Légende du nœud , recherchez le premier nœud qui a des nœuds enfants.

    Si un nœud de série a des enfants, l’arborescence qui apparaît sous l’onglet Modèle de la visionneuse Microsoft Time Series a également une structure de branchement.

  5. Développez le nœud et cliquez sur l'un des nœuds enfants.

    La colonne NODE_DESCRIPTION du schéma contient la condition qui a provoqué le fractionnement de l'arborescence.

  6. Dans le volet Légende du nœud , cliquez sur le nœud ARIMA le plus haut, puis développez le nœud jusqu’à ce que tous les nœuds enfants soient visibles.

  7. Dans le volet Détails du nœud , affichez la valeur de ATTRIBUTE_NAME.

    Cette valeur vous indique quelle série chronologique est contenue dans ce nœud. Le nœud de premier niveau dans la section ARIMA doit correspondre au nœud de premier niveau dans la section (Tout). Dans l'exemple AdventureWorks, ce nœud contient l'analyse ARIMA de la série M200 Europe.

Pour plus d’informations, consultez Contenu du modèle d’exploration de données pour les modèles de série chronologique (Analysis Services - Exploration de données).

Retour en haut

Tâche suivante de la leçon

Création de prédictions de série chronologique (Didacticiel intermédiaire sur l'exploration de données)

Voir aussi

Time Series Model Query Examples
Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)