Leçon 1 : Création de la structure d'exploration de données Bike Buyer
Mis à jour : 15 septembre 2007
Dans cette leçon, vous allez créer une structure d'exploration de données à l'aide de laquelle vous pouvez prévoir si un acheteur potentiel de Adventure Works Cycles est intéressé par l'achat d'un vélo. Si les structures d'exploration et leurs rôles dans le cadre de l'exploration de données vous sont inconnus, consultez Structures d'exploration de données (Analysis Services).
La structure d'exploration de données Bike Buyer que vous allez créer au cours de cette leçon autorise l'ajout de modèles d'exploration de données fondés sur l'Algorithme MDT (Microsoft Decision Trees) et l'Algorithme Clusters Microsoft. Au cours d'autres leçons, vous utiliserez les modèles d'exploration de données clustering pour examiner différentes méthodes de regroupement des clients et exploiterez les modèles d'exploration de données d'arbre de décision pour déterminer si un client potentiel est susceptible d'acheter un vélo.
Instruction CREATE MINING STRUCTURE
Pour créer une structure d'exploration de données, vous devez utiliser l'instruction CREATE MINING STRUCTURE (DMX). Le code de cette instruction peut être divisé selon les sections suivantes :
- Attribution d'un nom à la structure
- Définition de la colonne clé
- Définition des colonnes d'exploration de données
L'exemple générique suivant utilise l'instruction CREATE MINING STRUCTURE :
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
La première ligne du code définit le nom de la structure :
CREATE MINING STRUCTURE [<mining structure name>]
Pour plus d'informations sur l'attribution d'un nom à un objet dans DMX, consultez Identificateurs (DMX).
La ligne suivante du code définit la colonne clé de la structure d'exploration de données qui identifie de manière unique une entité au sein des données source :
<key column>,
Dans cette structure d'exploration de données, l'identificateur du client (CustomerKey) définit une entité dans les données sources.
La dernière ligne du code permet de définir les colonnes d'exploration de données que doivent utiliser les modèles d'exploration de données associés à la structure d'exploration de données :
<mining structure columns>
Vous pouvez utiliser la fonction DISCRETIZE dans les <colonnes de structure d'exploration de données> pour modifier les valeurs d'une colonne continue en une série de valeurs discrètes, comme dans la syntaxe suivante :
DISCRETIZE(<method>,<number of buckets>)
Pour plus d'informations sur la discrétisation des colonnes, consultez Méthodes de discrétisation. Pour plus d'informations sur les types de colonnes de structure d'exploration de données qu'il est possible de définir, consultez Colonnes de structure d'exploration de données.
Tâches de la leçon
Au cours de cette leçon, vous allez effectuer les tâches suivantes :
- créer une requête vide ;
- modifier la requête pour créer la structure d'exploration de données ;
- exécuter la requête.
Création de la requête
La première étape consiste à se connecter à une instance de Analysis Services et à créer une nouvelle requête DMX dans SQL Server Management Studio.
Pour créer une requête DMX dans SQL Server Management Studio
Ouvrez SQL Server Management Studio.
Dans la boîte de dialogue Se connecter au serveur, sélectionnez Analysis Services dans la zone Type de serveur. Dans Nom du serveur, tapez LocalHost ou bien le nom de l'instance de Analysis Services à laquelle vous souhaitez vous connecter pour cette leçon. Cliquez sur Se connecter.
Dans l'Explorateur d'objets, cliquez avec le bouton droit sur l'instance de Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.
L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.
Modification de la requête
L'étape suivante implique de modifier l'instruction CREATE MINING STRUCTURE décrite ci-avant en vue de créer la structure d'exploration de données Bike Buyer.
Pour personnaliser l'instruction CREATE MINING STRUCTURE
Dans l'Éditeur de requête, copiez l'exemple générique de l'instruction CREATE MINING STRUCTURE dans la requête vide.
Remplacez le code suivant :
[<mining structure>]
par :
[Bike Buyer]
Remplacez le code suivant :
<key column>
par :
CustomerKey LONG KEY
Remplacez le code suivant :
<mining structure columns>
par :
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS
L'instruction complète de la structure d'exploration de données doit se présenter comme suit :
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS )
Dans le menu Fichier, cliquez sur Enregistrer DMXQuery1.dmx sous.
Dans la boîte de dialogue Enregistrer sous, recherchez le dossier approprié et nommez le fichier Bike Buyer Structure.dmx.
Exécution de la requête
La dernière étape concerne l'exécution de la requête. Après avoir créé et enregistré une requête, vous devez exécuter les instructions de la requête pour créer la structure d'exploration de données sur le serveur. Pour plus d'informations sur l'exécution de requêtes dans l'Éditeur de requête, consultez Requête Transact-SQL - SQL Server Management Studio.
Pour exécuter la requête
Dans la barre d'outils de l'Éditeur de requête, cliquez sur Exécuter.
L'état de la requête s'affiche sous l'onglet Messages en bas de l'Éditeur de requête une fois l'exécution de l'instruction terminée. Les messages doivent révéler le texte suivant :
Executing the query Execution complete
Une nouvelle structure appelée Bike Buyer existe désormais sur le serveur.
Dans la leçon suivante, vous allez ajouter des modèles d'exploration de données à la structure que vous venez de créer.