PredictTimeSeries (DMX)
Retourne les valeurs suivantes prédites pour les données de série chronologique. Les données de séries chronologiques étant continues, elles ne peuvent être stockées ni dans une table imbriquée ni dans une table de cas. La fonction PredictTimeSeries retourne toujours une table imbriquée.
Syntaxe
PredictTimeSeries(<table column reference>)
PredictTimeSeries(<table column reference>, n)
PredictTimeSeries(<table column reference>, n-start, n-end)
PredictTimeSeries(<scalar column reference>)
PredictTimeSeries(<scalar column reference>, n)
PredictTimeSeries(<scalar column reference>, n-start, n-end)
PredictTimeSeries(<table column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<table column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
PredictTimeSeries(<scalar column reference>, n-start, n-end, REPLACE_MODEL_CASES | EXTEND_MODEL_CASES) PREDICTION JOIN <source query>
Arguments
<table column reference>, <scalar column referenc>
Spécifie le nom de la colonne à prédire. La colonne peut contenir des données scalaires ou tabulaires.n
Spécifie le nombre d'étapes suivantes à prédire. Si aucune valeur n'est spécifiée pour n, la valeur par défaut est 1.n ne peut pas être 0. La fonction retourne une erreur si vous ne faites pas au moins une prédiction.
n-start, n-end
Spécifie une plage d'étapes de série chronologique.n-start doit être un entier différent de 0.
n-end doit être un entier supérieur à n-start.
<source query>
Définit les données externes qui sont utilisées pour faire des prédictions.REPLACE_MODEL_CASES | EXTEND_MODEL_CASES
Indique comment gérer de nouvelles données.REPLACE_MODEL_CASES spécifie que les points de données dans le modèle doivent être remplacés par les nouvelles données. Toutefois, les prédictions sont basées sur les modèles dans le modèle d'exploration de données existant.
EXTEND_MODEL_CASES spécifie que les nouvelles données doivent être ajoutées au jeu de données d'apprentissage d'origine. Les futures prédictions sont élaborées uniquement sur le jeu de données composite après que les nouvelles données ont été utilisées.
Ces arguments peuvent être uniquement utilisés lorsque les nouvelles données sont ajoutées à l'aide d'une instruction PREDICTION JOIN. Si vous utilisez une requête PREDICTION JOIN et que vous ne spécifiez pas d'argument, la valeur par défaut est EXTEND_MODEL_CASES.
Type de valeur renvoyé
<table expression>.
Notes
L'algorithme MTS (Microsoft Time Series) ne prend pas en charge la prédiction historique lorsque vous utilisez l'instruction PREDICTION JOIN pour ajouter de nouvelles données.
Dans une instruction PREDICTION JOIN, le processus de prédiction commence toujours à l'étape venant immédiatement après la fin de la série d'apprentissage d'origine. Cela est vrai même si vous ajoutez de nouvelles données. Par conséquent, le paramètre n et les valeurs de paramètre n-start doivent être des entiers supérieurs à 0.
Notes
La longueur des nouvelles données n'affecte pas le point de départ de la prédiction. Par conséquent, si vous souhaitez ajouter de nouvelles données et faire de nouvelles prédictions, assurez-vous soit d'attribuer au point de départ de prédiction une valeur supérieure à la longueur des nouvelles données, soit d'étendre le point de fin de prédiction de la durée des nouvelles données.
Exemple
Les exemples suivants montrent comment faire des prédictions sur un modèle de série chronologique existant :
Le premier exemple montre comment faire un nombre spécifié de prédictions basées sur le modèle actif.
Le deuxième exemple indique comment utiliser le paramètre REPLACE_MODEL_CASES pour appliquer les modèles dans le modèle spécifié à un nouveau jeu de données.
Le troisième exemple indique comment utiliser le paramètre EXTEND_MODEL_CASES pour mettre à jour un modèle d'exploration de données avec de nouvelles données.
Pour en savoir plus sur l'utilisation des modèles de série chronologique, consultez le didacticiel d'exploration de données, Leçon 2 : génération d'un scénario de prévision (Didacticiel intermédiaire sur l'exploration de données) et Didacticiel DMX sur la prédiction de série chronologique.
Notes
Vous pouvez obtenir des résultats différents de votre modèle ; les résultats des exemples suivants sont fournis uniquement pour illustrer le format de résultat.
Exemple 1 : Prédiction de plusieurs tranches de temps
L'exemple suivant utilise la fonction PredictTimeSeries pour retourner une prédiction des trois prochaines étapes de la série M200 dans les régions Europe et Pacifique et en limiter les résultats. Dans ce modèle spécifique, l'attribut prédictible est Quantity ; vous devez donc utiliser [Quantity] comme premier argument de la fonction PredictTimeSeries.
SELECT FLATTENED
[Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity],3)AS t
FROM
[Forecasting]
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific'
Résultats attendus :
Model Region |
t.$TIME |
t.Quantity |
---|---|---|
M200 Europe |
25/07/2008 12:00:00 |
121 |
M200 Europe |
25/08/2008 12:00:00 |
142 |
M200 Europe |
25/09/2008 12:00:00 |
152 |
M200 Pacific |
25/07/2008 12:00:00 |
46 |
M200 Pacific |
25/08/2008 12:00:00 |
44 |
M200 Pacific |
25/09/2008 12:00:00 |
42 |
Dans cet exemple, le mot clé FLATTENED a été utilisé pour simplifier la lecture des résultats. Si vous n'utilisez pas le mot clé FLATTENED et qu'à la place vous retournez un ensemble de lignes hiérarchique, cette requête retourne deux colonnes. La première contient la valeur de [ModelRegion] et la deuxième une table imbriquée à deux colonnes : $TIME, qui affiche les tranches de temps prédites, et Quantity, qui contient les valeurs prédites.
Exemple 2 : ajout de nouvelles données et utilisation de REPLACE_MODEL_CASES
Supposez que vous constatez que les données étaient incorrectes pour une région particulière et que vous souhaitez utiliser les modèles dans le modèle, tout en ajustant les prédictions pour qu'elles correspondent aux nouvelles données. Ou il se peut que vous constatiez qu'une autre région a des tendances plus fiables et que vous souhaitiez appliquer le modèle le plus fiable aux données d'une région différente.
Dans de tels scénarios, vous pouvez utiliser le paramètre REPLACE_MODEL_CASES et spécifier un nouveau jeu de données à utiliser comme données d'historique. De cette façon, les projections seront basées sur les modèles dans le modèle spécifié, mais continueront de manière fluide à partir de la fin des nouveaux points de données. Pour une procédure pas à pas complète de ce scénario, consultez Ajout d'un modèle de prévision agrégée (Didacticiel intermédiaire sur l'exploration de données).
La requête PREDICTION JOIN suivante illustre la syntaxe pour remplacer des données et élaborer de nouvelles prédictions. Pour les données de remplacement, l'exemple récupère la valeur des colonnes Amount et Quantity et multiplie chacune par deux :
SELECT [Forecasting].[Model Region],
PredictTimeSeries([Forecasting].[Quantity], 3, REPLACE_MODEL_CASES)
FROM
[Forecasting]
PREDICTION JOIN
OPENQUERY([Adventure Works DW2008R2],
'SELECT [ModelRegion],
([Quantity] * 2) as Quantity,
([Amount] * 2) as Amount,
[ReportingDate]
FROM [dbo].vTimeSeries
WHERE ModelRegion = N''M200 Pacific''
') AS t
ON
[Forecasting].[Model Region] = t.[ Model Region] AND
[Forecasting].[Reporting Date] = t.[ReportingDate] AND
[Forecasting].[Quantity] = t.[Quantity] AND
[Forecasting].[Amount] = t.[Amount]
Le tableau suivant compare les résultats de prédiction.
Prédictions d'origine |
Prédictions mises à jour |
---|---|
M200 Pacific25/07/2008 12:00:0046
M200 Pacific25/08/2008 12:00:0044
M200 Pacific25/09/2008 12:00:0042
|
M200 Pacific25/07/2008 12:00:0091
M200 Pacific25/08/2008 12:00:0089
M200 Pacific25/09/2008 12:00:0084
|
Exemple 3 : ajout de nouvelles données et utilisation d'EXTEND_MODEL_CASES
L'exemple 3 illustre l'utilisation de l'option EXTEND_MODEL_CASES pour fournir de nouvelles données, ajoutées à la fin d'une série de données existante. Plutôt que de remplacer les points de données existants, les nouvelles données sont ajoutées au modèle.
Dans l'exemple suivant, les nouvelles données sont fournies dans l'instruction SELECT qui suit NATURAL PREDICTION JOIN. Vous pouvez fournir plusieurs lignes de nouvelle entrée avec cette syntaxe, mais chaque nouvelle ligne d'entrée doit avoir un horodatage unique :
SELECT [Model Region],
PredictTimeSeries([Forecasting].[Quantity], 5, EXTEND_MODEL_CASES)
FROM
[Forecasting]
NATURAL PREDICTION JOIN
(SELECT
1 as [Reporting Date],
10 as [Quantity],
'M200 Europe' AS [Model Region]
UNION SELECT
2 as [Reporting Date],
15 as [Quantity],
'M200 Europe' AS [Model Region]
) AS T
WHERE ([Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 Pacific')
La requête utilisant l'option EXTEND_MODEL_CASES, Analysis Services entreprend les actions suivantes pour faire ses prédictions :
Augmente la taille totale des cas d'apprentissage en ajoutant les deux nouveaux mois de données au modèle.
Démarre les prédictions à la fin des données de cas précédentes. Par conséquent, les deux premières prédictions représentent les nouveaux chiffres de ventes réels que vous venez d'ajouter au modèle.
Retourne de nouvelles prédictions pour les trois tranches de temps restantes selon le modèle nouvellement développé.
Le tableau suivant répertorie les résultats de la requête de l'exemple 2. Remarquez que les deux premières valeurs retournées pour M200 Europe sont exactement les mêmes que les nouvelles valeurs que vous avez fournies. Ce comportement est inhérent à la conception ; si vous souhaitez démarrer des prédictions après la fin des nouvelles données, vous devez spécifier des étapes de début et de fin. Pour obtenir un exemple de cette procédure, consultez Leçon 5 : Extension du modèle de série chronologique.
Notez également que vous n'avez pas fourni de nouvelles données pour la région Pacifique. Par conséquent, Analysis Services retourne de nouvelles prédictions pour les cinq tranches de temps.
Quantity |
EXTEND_MODEL_CASES |
---|---|
M200 Europe |
$TIMEQuantity
7/25/2008 0:0010
8/25/2008 0:0015
9/25/2008 0:0072
10/25/2008 0:0069
11/25/2008 0:0068
|
M200 Pacific |
$TIMEQuantity
7/25/2008 0:0046
8/25/2008 0:0044
9/25/2008 0:0042
10/25/2008 0:0042
11/25/2008 0:0038
|
Exemple 4 : retour de statistiques dans une prédiction de série chronologique
La fonction PredictTimeSeries n'accepte pas INCLUDE_STATISTICS en tant que paramètre. Toutefois, la requête suivante peut être utilisée pour retourner les statistiques de prédiction pour une requête de série chronologique. Cette approche peut également être suivie avec des modèles qui ont des colonnes de tables imbriquées.
Dans ce modèle spécifique, l'attribut prédictible est Quantity ; vous devez donc utiliser [Quantity] comme premier argument de la fonction PredictTimeSeries. Si votre modèle utilise un autre attribut prédictible, vous pouvez substituer un nom de colonne différent.
SELECT FLATTENED [Model Region],
(SELECT
$Time,
[Quantity] as [PREDICTION],
PredictVariance([Quantity]) AS [VARIANCE],
PredictStdev([Quantity]) AS [STDEV]
FROM
PredictTimeSeries([Quantity], 3) AS t
) AS t
FROM Forecasting
WHERE [Model Region] = 'M200 Europe'
OR [Model Region] = 'M200 North America'
Exemples de résultats :
Model Region |
t.$TIME |
t.PREDICTION |
t.VARIANCE |
t.STDEV |
---|---|---|---|---|
M200 Europe |
25/07/2008 12:00:00 |
121 |
11.6050581415597 |
3.40661975300439 |
M200 Europe |
25/08/2008 12:00:00 |
142 |
10.678201866621 |
3.26775180615374 |
M200 Europe |
25/09/2008 12:00:00 |
152 |
9.86897842568614 |
3.14149302493037 |
M200 North America |
25/07/2008 12:00:00 |
163 |
1.20434529288162 |
1.20434529288162 |
M200 North America |
25/08/2008 12:00:00 |
178 |
1.65031343900634 |
1.65031343900634 |
M200 North America |
25/09/2008 12:00:00 |
156 |
1.68969399185442 |
1.68969399185442 |
Notes
Le mot clé FLATTENED a été utilisé dans cet exemple pour simplifier la présentation des résultats dans une table ; toutefois, si votre fournisseur prend en charge les ensembles de lignes hiérarchiques, vous pouvez omettre ce mot clé. Si vous omettez le mot clé FLATTENED, la requête retourne deux colonnes, la première contenant la valeur qui identifie la série de données [Model Region] et la deuxième contenant la table imbriquée de statistiques.