Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Lorsque vous préparez des données à utiliser dans un modèle de prévision, vous devez vous assurer que vos données contiennent une colonne qui peut être utilisée pour identifier les étapes de la série chronologique. Cette colonne sera désignée comme Key Time colonne. Comme il s’agit d’une clé, la colonne doit contenir des valeurs numériques uniques.
Le choix de l’unité appropriée pour la colonne est une partie importante de l’analyse Key Time . Par exemple, supposons que vos données de ventes sont actualisées d’une minute par minute. Vous n’utiliseriez pas nécessairement les minutes comme unité pour la série chronologique ; il pourrait être plus significatif de regrouper les données de ventes par jour, semaine ou même mois. Si vous ne savez pas quelle unité de temps utiliser, vous pouvez créer une vue de source de données pour chaque agrégation et créer des modèles associés pour voir si différentes tendances émergent à chaque niveau d’agrégation.
Pour ce tutoriel, les données de vente sont collectées quotidiennement dans la base de données de ventes transactionnelles, mais pour l’exploration de données, les données ont été pré-agrégées par mois, à l’aide d’une vue.
En outre, il est souhaitable d’analyser que les données ont le plus peu d’écarts possible. Si vous envisagez d’analyser plusieurs séries de données, toutes les séries doivent de préférence commencer et se terminer à la même date. Si les données ont des lacunes, mais que les lacunes ne sont pas au début ou à la fin d’une série, vous pouvez utiliser le paramètre MISSING_VALUE_SUBSTITUTION pour remplir la série. Analysis Services fournit également plusieurs options pour remplacer les données manquantes par des valeurs, telles que l’utilisation de moyens ou de constantes.
Avertissement
Les outils de graphique croisé dynamique et de tableau croisé dynamique inclus dans les versions antérieures du concepteur de vues de source de données ne sont plus fournis. Nous vous recommandons d’identifier les lacunes dans les données de série chronologique au préalable, à l’aide d’outils tels que le Profileur de données inclus dans Integration Services.
Pour identifier la clé de temps du modèle de prévision
Dans le volet, SalesByRegion.dsv [Design], cliquez avec le bouton droit sur la table vTimeSeries, puis sélectionnez Explorer les données.
Un nouvel onglet s’ouvre, intitulé Explorer la table vTimeSeries.
Sous l’onglet Tableau , passez en revue les données utilisées dans les colonnes TimeIndex et Date de création de rapports.
Les deux sont des séquences avec des valeurs uniques et peuvent être utilisées comme clé de série chronologique ; toutefois, les types de données des colonnes sont différents. L’algorithme Microsoft Time Series ne nécessite pas de
datetimetype de données, mais uniquement que les valeurs soient distinctes et ordonnées. Par conséquent, l’une ou l’autre colonne peut être utilisée comme clé de temps pour le modèle de prévision.Dans l’aire de conception de la vue de source de données, sélectionnez la colonne Date de rapport et sélectionnez Propriétés. Ensuite, cliquez sur la colonne TimeIndex, puis sélectionnez Propriétés.
Le champ TimeIndex a le type de données System.Int32, tandis que le champ Date de création de rapports a le type de données System.DateTime. De nombreux entrepôts de données convertissent les valeurs de date/heure en entiers et utilisent la colonne entière comme clé pour améliorer les performances d’indexation. Toutefois, si vous utilisez cette colonne, l’algorithme Microsoft Time Series effectue des prédictions à l’aide de valeurs futures telles que 201014, 201014, etc. Étant donné que vous souhaitez représenter vos prévisions de données de vente à l’aide de dates de calendrier, vous allez utiliser la colonne Date de création de rapports comme identificateur de série unique.
Pour définir la clé dans la vue de la source de données
Dans le volet SalesByRegion.dsv, sélectionnez la table vTimeSeries.
Cliquez avec le bouton droit sur la colonne, la date de création de rapports, puis sélectionnez Définir la clé primaire logique.
Gestion des données manquantes (facultatif)
Si une série a des données manquantes, vous risquez d’obtenir une erreur lorsque vous essayez de traiter le modèle. Vous avez plusieurs façons de contourner les données manquantes :
Analysis Services peut remplir des valeurs manquantes, soit en calculant une moyenne, soit en utilisant une valeur précédente. Pour ce faire, définissez le paramètre MISSING_VALUE_SUBSTITUTION sur le modèle d’exploration de données. Pour plus d’informations sur ce paramètre, consultez Microsoft Time Series Algorithm Technical Reference. Pour plus d’informations sur la modification des paramètres sur un modèle d’exploration de données existant, consultez Afficher ou Modifier les paramètres d’algorithme.
Vous pouvez modifier la source de données ou filtrer la vue sous-jacente pour éliminer les séries raguées ou remplacer des valeurs. Vous pouvez le faire dans la source de données relationnelle, ou vous pouvez modifier la vue de source de données en créant des requêtes nommées personnalisées ou des calculs nommés. Pour plus d’informations, consultez Vues de source de données dans les modèles multidimensionnels. Une tâche ultérieure dans cette leçon fournit un exemple de création à la fois d’une requête nommée et d’un calcul personnalisé.
Pour ce scénario, certaines données sont manquantes au début d’une série : autrement dit, il n’existe aucune donnée pour la gamme de produits T1000 jusqu’en juillet 2007. Sinon, toutes les séries se terminent à la même date et il n’y a pas de valeurs manquantes.
L’exigence de l’algorithme Microsoft Time Series est que toutes les séries que vous incluez dans un modèle unique doivent avoir le même point de terminaison . Étant donné que le modèle de vélo T1000 a été introduit en 2007, les données de cette série commencent plus tard que pour d’autres modèles de vélos, mais la série se termine à la même date ; par conséquent, les données sont utilisables.
Pour fermer le concepteur de vues de source de données
- Cliquez avec le bouton droit sur l’onglet, Explorez la table vTimeSeries, puis sélectionnez Fermer.