Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
L’algorithme Microsoft Time Series fournit des paramètres qui affectent la création d’un modèle et la façon dont les données temporelles sont analysées. La modification de ces propriétés peut affecter considérablement la façon dont le modèle d’exploration de données effectue des prédictions.
Pour cette tâche dans le tutoriel, vous allez effectuer les tâches suivantes pour modifier le modèle :
Vous allez personnaliser la façon dont votre modèle gère les périodes de temps en ajoutant une nouvelle valeur pour le paramètre PERIODICITY_HINT .
Vous découvrirez deux autres paramètres importants pour l’algorithme Microsoft Time Series : FORECAST_METHOD, qui vous permet de contrôler la méthode utilisée pour la prévision et PREDICTION_SMOOTHING, ce qui vous permet de personnaliser le mélange de prédictions à long terme et à court terme.
Si vous le souhaitez, vous indiquez à l’algorithme comment les valeurs manquantes doivent être imputées.
Une fois que toutes les modifications ont été apportées, vous allez déployer et traiter le modèle.
Définition des paramètres de série chronologique
Indicateurs de périodicité
Le paramètre PERIODICITY_HINT fournit à l’algorithme des informations sur les périodes supplémentaires que vous prévoyez de voir dans les données. Par défaut, les modèles de série chronologique essaient de détecter automatiquement un modèle dans les données. Toutefois, si vous connaissez déjà le cycle de temps attendu, la fourniture d’un indicateur de périodicité peut potentiellement améliorer la précision du modèle. Toutefois, si vous fournissez un indicateur de périodicité incorrect, il peut diminuer la précision ; par conséquent, si vous ne savez pas quelle valeur doit être utilisée, il est préférable d’utiliser la valeur par défaut.
Par exemple, la vue utilisée pour ce modèle agrège les données de ventes d’Adventure Works DW Multidimensional 2012 sur une base mensuelle. Par conséquent, chaque tranche de temps utilisée par le modèle représente un mois, et toutes les prédictions seront également en termes de mois. Étant donné qu’il y a 12 mois dans une année et que vous vous attendez à ce que les modèles de ventes se répètent plus ou moins sur une base annuelle, vous définissez le paramètre 12
PERIODICITY_HINT sur , pour indiquer que 12 tranches de temps (mois) constituent un cycle de vente complet.
Méthode de prévision
Le paramètre FORECAST_METHOD contrôle si l’algorithme de série chronologique est optimisé pour les prédictions à court terme ou à long terme. Par défaut, le paramètre FORECAST_METHOD est défini sur MIXED, ce qui signifie que deux algorithmes différents sont mélangés et équilibrés pour fournir de bons résultats à la fois pour la prédiction à court et à long terme.
Toutefois, si vous savez que vous souhaitez utiliser un algorithme particulier, vous pouvez modifier la valeur en ARIMA ou ARTXP.
Pondération Long-Term par rapport aux prédictions de Short-Term
Vous pouvez également personnaliser la façon dont les prédictions à long terme et à court terme sont combinées à l’aide du paramètre PREDICTION_SMOOTHING. Par défaut, ce paramètre est défini sur 0,5, ce qui fournit généralement le meilleur équilibre pour la précision globale.
Pour modifier les paramètres d’algorithme
Sous l’onglet Modèles d’exploration de données, cliquez avec le bouton droit sur Prévision, puis sélectionnez Définir les paramètres d’algorithme.
Dans la
PERIODICITY_HINT
ligne de la boîte de dialogue Paramètres de l’algorithme , cliquez sur la colonne Valeur , puis tapez{12}
, y compris les accolades.Par défaut, l’algorithme ajoute également la valeur {1}.
Dans la
FORECAST_METHOD
ligne, vérifiez que la zone de texte Valeur est vide ou définie surMIXED
. Si une valeur différente a été entrée, tapezMIXED
pour remplacer le paramètre par la valeur par défaut.Dans la ligne PREDICTION_SMOOTHING , vérifiez que la zone de texte Valeur est vide ou définie sur 0,5. Si une autre valeur a été entrée, cliquez sur Valeur et tapez
0.5
pour remplacer le paramètre par la valeur par défaut.Remarque
Le paramètre PREDICTION_SMOOTHING est disponible uniquement dans SQL Server Enterprise. Par conséquent, vous ne pouvez pas afficher ou modifier la valeur du paramètre PREDICTION_SMOOTHING dans SQL Server Standard. Toutefois, le comportement par défaut consiste à utiliser les deux algorithmes et à les pondérationr de façon égale.
Cliquez sur OK.
Gestion des données manquantes (facultatif)
Dans de nombreux cas, vos données de vente peuvent avoir des lacunes remplies avec des valeurs null, ou un magasin peut avoir échoué à respecter la date limite de rapport, laissant une cellule vide à la fin de la série. Dans de tels scénarios, Analysis Services déclenche l’erreur suivante et ne traite pas le modèle.
"Erreur (exploration de données) : horodatages non synchronisés à partir de la série <nom de série>, du modèle d’exploration <nom du modèle>." Toutes les séries chronologiques doivent se terminer en même temps et ne peuvent pas avoir de points de données arbitrairement manquants. Si vous définissez le paramètre MISSING_VALUE_SUBSTITUTION sur Previous ou sur une constante numérique, vous corrigez automatiquement les points de données manquants si possible. »
Pour éviter cette erreur, vous pouvez spécifier que Analysis Services fournit automatiquement de nouvelles valeurs pour combler les lacunes à l’aide de l’une des méthodes suivantes :
Utilisation d’une valeur moyenne. La moyenne est calculée à l’aide de toutes les valeurs valides dans la même série de données.
Utilisation de la valeur précédente. Vous pouvez remplacer les valeurs précédentes pour plusieurs cellules manquantes, mais vous ne pouvez pas remplir les valeurs de départ.
Utilisation d’une valeur constante que vous fournissez.
Pour spécifier que les lacunes doivent être remplies par des valeurs moyennes
Sous l’onglet Modèles d’exploration de données, cliquez avec le bouton droit sur la colonne Prévision , puis sélectionnez Définir les paramètres d’algorithme.
Dans la boîte de dialogue Paramètres de l’algorithme , dans la ligne MISSING_VALUE_SUBSTITUTION , cliquez sur la colonne Valeur et tapez
Mean
.
Générer le modèle
Pour utiliser le modèle, vous devez le déployer sur un serveur et traiter le modèle en exécutant les données d’apprentissage via l’algorithme.
Pour traiter le modèle de prévision
Dans le menu Modèle d’exploration de données de SQL Server, sélectionnez Structure d’exploration de données processus et Tous les modèles.
Dans l’avertissement indiquant si vous souhaitez générer et déployer le projet, cliquez sur Oui.
Dans la boîte de dialogue Structure d’exploration de données de processus - Prévision , cliquez sur Exécuter.
La boîte de dialogue Progression du processus s’ouvre pour afficher des informations sur le traitement du modèle. Le traitement du modèle peut prendre un certain temps.
Une fois le traitement terminé, cliquez sur Fermer pour quitter la boîte de dialogue Progression du processus .
Cliquez à nouveau sur Fermer pour quitter la boîte de dialogue Structure d’exploration de données de processus - Prévision .
Tâche suivante de la leçon
Exploration du modèle de prévision (didacticiel d’exploration de données intermédiaire)
Voir aussi
Informations techniques de référence sur l’algorithme Microsoft Time Series
Algorithme Microsoft Time Series
Exigences et considérations relatives au traitement (exploration de données)