Didacticiel DMX Bike Buyer
Mis à jour : 15 septembre 2007
Dans ce didacticiel, vous allez apprendre à créer, assimiler et explorer des modèles d'exploration de données à l'aide du langage de requête DMX (Data Mining Extensions). Vous utiliserez ensuite ces modèles pour créer des tâches de prédiction déterminant si un client envisage ou non d'acheter un vélo.
Les modèles d'exploration de données seront créés à partir des données de la société fictive Adventure Works Cycles stockées dans la base de données exemple AdventureWorksDW. Adventure Works Cycles est une importante entreprise multinationale spécialisée dans la fabrication de vélos. L'entreprise fabrique et vend des bicyclettes métalliques et des bicyclettes en alliage sur les marchés nord-américain, européen et asiatique. Son siège qui compte 290 employés est situé à Bothell dans l'état de Washington aux États-Unis ; elle dispose de plusieurs équipes commerciales réparties dans diverses régions du monde constituant son marché de base. Pour plus d'informations sur la base de données exemple AdventureWorksDW, consultez Entrepôt de données exemple AdventureWorks.
Scénario du didacticiel
Adventure Works Cycles a décidé d'étendre l'analyse de ses données en créant une application personnalisée qui exploite des fonctionnalités d'exploration de données. Son application personnalisée vise les objectifs suivants :
- Recueillir en guise de données les caractéristiques spécifiques d'un client potentiel et déterminer son intention ou non d'acheter un vélo.
- Recueillir en guise de données une liste de clients potentiels et les caractéristiques de ces clients, puis déterminer les clients susceptibles d'acheter des vélos.
Dans le premier cas, les données des clients proviennent d'une page d'enregistrement des clients ; dans le deuxième cas, une liste de clients potentiels est obtenue auprès du service marketing de Adventure Works Cycles.
Qui plus est, le service marketing demande s'il est possible de regrouper des clients existants par catégories selon diverses caractéristiques, notamment le lieu de résidence, le nombre d'enfants à charge et la distance parcourue pour se rendre au travail et en revenir. Les responsables de ce service souhaitent savoir s'il est possible d'utiliser ces clusters pour cibler des catégories précises de clients. Cette recherche exige un autre modèle d'exploration de données.
Microsoft SQL Server 2005 Analysis Services (SSAS) offre plusieurs outils permettant d'accomplir ces tâches :
- Langage de requête DMX
- Algorithmes Microsoft Decision Trees et Microsoft Clustering
- Éditeur de requête dans SQL Server Management Studio
Le langage de requête DMX (Data Mining Extensions) fourni par Analysis Services permet de créer et d'utiliser des modèles d'exploration de données. L'algorithme Microsoft Decision Trees (MDT) permet de créer des modèles que vous pouvez utiliser pour prévoir les intentions d'achat de vélo d'une personne. Le modèle obtenu permet d'exploiter un seul client ou un ensemble de clients en guise de données. L'algorithme Microsoft Clustering permet de créer des groupes de clients sur la base de caractéristiques communes. L'objectif de ce didacticiel est de fournir des scripts DMX à utiliser dans l'application personnalisée.
Pour plus d'informations, consultez la rubrique suivante :Utilisation de l'exploration de données
Structure et modèles d'exploration de données
Avant de créer des instructions DMX, il est primordial de comprendre les objets principaux auxquels Analysis Services fait appel pour créer des modèles d'exploration de données. La structure d'exploration de données est une structure de données qui définit le domaine de données à partir duquel les modèles d'exploration de données sont créés. Une structure d'exploration de données unique peut contenir plusieurs de ces modèles partageant le même domaine. Un modèle d'exploration applique un algorithme de modèle d'exploration aux données qui sont représentées par une structure d'exploration de données.
Les composants constituant la structure d'exploration de données sont les colonnes de structure d'exploration de données qui décrivent les données inscrites dans la source de données. Ces colonnes contiennent des informations, telles que le type de données, le type de contenu et le mode de distribution des données.
Les modèles d'exploration de données doivent contenir la colonne clé décrite dans la structure d'exploration de données, ainsi qu'un sous-ensemble des colonnes restantes. Le modèle d'exploration de données détermine l'usage de chaque colonne et définit l'algorithme utilisé pour sa création. Par exemple, dans DMX, vous pouvez définir une colonne comme étant une colonne clé ou une colonne PREDICT. Une colonne non définie est considérée comme une colonne d'entrée.
Deux méthodes permettent de créer des modèles d'exploration de données dans DMX. Vous pouvez soit créer ensemble la structure d'exploration de données et le modèle qui y est associé par le biais de l'instruction CREATE MINING MODEL, soit créer d'abord une structure d'exploration de données à l'aide de l'instruction CREATE MINING STRUCTURE, puis ajouter un modèle d'exploration de données à la structure à l'aide de l'instruction ALTER STRUCTURE. Ces méthodes sont décrites ci-dessous.
CREATE MINING MODEL
Utilisez cette instruction pour créer en même temps une structure d'exploration de données et son modèle associé en utilisant le même nom. Le nom du modèle d'exploration de données est ajouté à la mention « Structure » pour le différencier de la structure d'exploration de données. Cette instruction est utile si vous créez une structure d'exploration de données conçue pour accueillir un seul modèle d'exploration de données.Pour plus d'informations, consultez CREATE MINING MODEL (DMX).
ALTER MINING STRUCTURE
Utilisez cette instruction pour ajouter un modèle d'exploration de données à une structure d'exploration de données existant déjà sur le serveur. Cette instruction est utile si vous souhaitez créer une structure d'exploration de données abritant plusieurs modèles d'exploration de données différents. Plusieurs raisons peuvent vous inciter à ajouter plusieurs modèles d'exploration de données dans une structure d'exploration de données unique. Par exemple, vous pouvez créer plusieurs modèles d'exploration de données à l'aide de différents algorithmes pour savoir lequel fonctionne le mieux avec vos données. Vous pouvez créer plusieurs modèles d'exploration de données avec le même algorithme, mais avec un paramètre défini différemment pour que chaque modèle puisse trouver la meilleure définition pour ce paramètre.Pour plus d'informations, consultez ALTER MINING STRUCTURE (DMX).
Puisque vous allez créer une structure d'exploration de données dotée de plusieurs modèles d'exploration de données, vous devrez adopter la deuxième méthode de ce didacticiel.
Pour plus d'informations
Guide de référence du langage DMX (Data Mining Extensions), Présentation de l'instruction Select (DMX), Requêtes de prévision (DMX)
Contenu du didacticiel
Ce didacticiel contient les leçons suivantes :
- Leçon 1 : Création de la structure d'exploration de données Bike Buyer
Dans cette leçon, vous allez apprendre à manipuler l'instruction CREATE pour créer des structures d'exploration de données.
- Leçon 2 : Ajout de modèles d'exploration de données à la structure d'exploration de données Bike Buyer
Dans cette leçon, vous allez apprendre à manipuler l'instruction ALTER pour ajouter des modèles d'exploration de données à une structure d'exploration de données.
- Leçon 3 : Traitement de la structure d'exploration de données Bike Buyer
Dans cette leçon, vous allez apprendre à manipuler l'instruction INSERT INTO pour gérer des structures d'exploration de données et les modèles qui y sont associés.
- Leçon 4 : Exploration des modèles d'exploration de données Bike Buyer
Dans cette leçon, vous allez apprendre à manipuler l'instruction SELECT pour explorer le contenu des modèles d'exploration de données.
- Leçon 5 : Exécution des requêtes de prédiction
Dans cette leçon, vous allez apprendre à manipuler l'instruction PREDICTION JOIN pour établir des prédictions en fonction des modèles d'exploration de données.
Configuration requise
Avant d'entamer ce didacticiel, assurez-vous que les éléments suivants sont installés :
- Microsoft SQL Server 2005
- Microsoft SQL Server 2005 Analysis Services (SSAS)
- Base de données AdventureWorks incluse dans SQL Server 2005. Pour des raisons de sécurité, les bases de données exemples ne sont pas installées par défaut. Pour plus d'informations sur l'installation des bases de données exemples, consultez Installation des exemples de bases de données AdventureWorks et d'autres exemples via le programme d'installation.
Remarque : |
---|
Lorsque vous parcourez les didacticiels, il est recommandé d'ajouter les boutons Rubrique suivante et Rubrique précédente dans la barre d'outils de l'afficheur de document. Pour plus d'informations, consultez Ajout des boutons Rubrique suivante et Rubrique précédente dans l'aide. |
Voir aussi
Concepts
Didacticiel DMX Market Basket
Didacticiel sur l'exploration de données
Autres ressources
Concepts d'exploration de données