Partager via


Leçon 1 : Création d’un modèle de série chronologique pour l'exploration de données et d’une structure d’exploration de données

Dans cette leçon, vous allez créer un modèle d’exploration de données qui vous permet de prédire des valeurs au fil du temps, en fonction des données historiques. Lorsque vous créez le modèle, la structure sous-jacente est générée automatiquement et peut être utilisée comme base pour des modèles d’exploration de données supplémentaires.

Cette leçon suppose que vous êtes familiarisé avec les modèles de prévision et avec les exigences de l’algorithme Microsoft Time Series. Pour plus d’informations, consultez l’algorithme Microsoft Time Series.

CRÉER UN MODÈLE DE MINAGE (instruction)

Pour créer un modèle d’exploration de données directement et générer automatiquement la structure d’exploration de données sous-jacente, vous utilisez l’instruction CREATE MINING MODEL (DMX). Le code de l’instruction peut être divisé en parties suivantes :

  • Nommage du modèle

  • Définition de l’horodatage

  • Définition de la colonne clé de série facultative

  • Définition de l’attribut ou des attributs prédictibles

Voici un exemple générique de l’instruction CREATE MINING MODEL :

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

La première ligne du code définit le nom du modèle d’exploration de données :

CREATE MINING MODEL [Mining Model Name]  

Analysis Services génère automatiquement un nom pour la structure sous-jacente, en ajoutant « _structure » au nom du modèle, ce qui garantit que le nom de la structure est unique à partir du nom du modèle. Pour plus d’informations sur l’affectation d’un nom à un objet dans DMX, consultez Identificateurs (DMX).

La ligne suivante du code définit la colonne clé du modèle d’exploration de données, qui, dans le cas d’un modèle de série chronologique identifie de manière unique une étape temporelle dans les données sources. L’étape de temps est identifiée avec les mots clés après le nom de colonne et les KEY TIME types de données. Si le modèle de série chronologique a une clé de série distincte, il est identifié à l’aide du KEY mot clé.

<key columns>  

La ligne suivante du code est utilisée pour définir les colonnes du modèle qui seront prédites. Vous pouvez avoir plusieurs attributs prédictibles dans un modèle unique d’exploration de données. Lorsqu’il existe plusieurs attributs prédictibles, l’algorithme Microsoft Time Series génère une analyse distincte pour chaque série :

<predictable attribute columns>  

Tâches de la leçon

Vous allez effectuer les tâches suivantes dans cette leçon :

  • Créer une requête vide

  • Modifier la requête pour créer le modèle d’exploration de données

  • exécuter la requête.

Création de la requête

La première étape consiste à se connecter à une instance d’Analysis Services et à créer une requête DMX dans SQL Server Management Studio.

Pour créer une requête DMX dans SQL Server Management Studio

  1. Ouvrez SQL Server Management Studio.

  2. Dans la boîte de dialogue Se connecter au serveur , pour le type de serveur, sélectionnez Analysis Services. Dans le nom du serveur, tapez LocalHostou le nom de l’instance d’Analysis Services à laquelle vous souhaitez vous connecter pour cette leçon. Cliquez sur Se connecter.

  3. Dans l’Explorateur d’objets, cliquez avec le bouton droit sur l’instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L’Éditeur de requête s’ouvre et contient une nouvelle requête vide.

Modification de la requête

L’étape suivante consiste à modifier l’instruction CREATE MINING MODEL pour créer le modèle d’exploration de données utilisé pour la prévision, ainsi que sa structure d’exploration de données sous-jacente.

Pour personnaliser l’instruction CREATE MINING MODEL

  1. Dans l’Éditeur de requête, copiez l’exemple générique de l’instruction CREATE MINING MODEL dans la requête vide.

  2. Remplacez ce qui suit :

    [mining model name]   
    

    avec :

    [Forecasting_MIXED]  
    
  3. Remplacez ce qui suit :

    <key columns>  
    

    avec :

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    Le TIME KEY mot clé indique que la colonne ReportingDate contient les valeurs d’étape de temps utilisées pour classer les valeurs. Les étapes temporelles peuvent être des dates et des heures, des entiers ou n’importe quel type de données ordonné, tant que les valeurs sont uniques et que les données sont triées.

    Les mots clés TEXT et KEY indiquent que la colonne ModelRegion contient une clé de série supplémentaire. Vous ne pouvez avoir qu’une seule clé de série, et les valeurs de la colonne doivent être distinctes.

  4. Remplacez ce qui suit :

    < predictable attribute columns> )  
    

    avec :

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Remplacez ce qui suit :

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    avec :

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Le paramètre d’algorithme, AUTO_DETECT_PERIODICITY = 0,8, indique que l’algorithme doit détecter les cycles dans les données. La définition de cette valeur plus proche de 1 favorise la découverte de nombreux modèles, mais peut ralentir le traitement.

    Le paramètre d’algorithme, FORECAST_METHODindique si vous souhaitez que les données soient analysées à l’aide d’ARTXP, d’ARIMA ou d’un mélange des deux.

    Le mot clé, WITH DRILLTHROUGHspécifiez que vous souhaitez être en mesure d’afficher des statistiques détaillées dans les données sources une fois le modèle terminé. Vous devez ajouter cette clause si vous souhaitez parcourir le modèle à l’aide de microsoft Time Series Viewer. Il n’est pas nécessaire pour la prédiction.

    L’instruction complète doit maintenant être la suivante :

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
    
  6. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx As.

  7. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier Forecasting_MIXED.dmx.

Exécution de la requête

La dernière étape consiste à exécuter la requête. Une fois qu’une requête est créée et enregistrée, elle doit être exécutée pour créer le modèle d’exploration de données et sa structure d’exploration de données sur le serveur. Pour plus d’informations sur l’exécution de requêtes dans l’Éditeur de requête, consultez l’Éditeur de requête du moteur de base de données (SQL Server Management Studio).

Pour exécuter la requête

  • Dans l’Éditeur de requête, dans la barre d’outils, cliquez sur Exécuter.

    L’état de la requête s’affiche sous l’onglet Messages en bas de l’Éditeur de requête une fois l’instruction terminée. Les messages doivent s’afficher :

    Executing the query   
    Execution complete  
    

    Une nouvelle structure nommée Forecasting_MIXED_Structure existe désormais sur le serveur, ainsi que le modèle d’exploration de données associé Forecasting_MIXED.

Dans la leçon suivante, vous allez ajouter un modèle d’exploration de données à la structure d’exploration de données Forecasting_MIXED que vous venez de créer.

Leçon suivante

Leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données Time Series

Voir aussi

Contenu du modèle d’exploration de données pour les modèles de série chronologique (Analysis Services - Exploration de données)
Informations techniques de référence sur l’algorithme Microsoft Time Series