Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Après avoir testé la précision de vos modèles d’exploration de données et décidé que vous êtes satisfait des résultats, vous pouvez ensuite générer des prédictions à l’aide du Générateur de requêtes de prédiction sous l’onglet Prédiction du modèle d’exploration de données dans le Concepteur d’exploration de données.
Le Générateur de requêtes de prédiction a trois vues. Avec les vues Création et Requête , vous pouvez générer et examiner votre requête. Vous pouvez ensuite exécuter la requête et afficher les résultats dans la vue Résultats .
Toutes les requêtes de prédiction utilisent DMX, qui est courte pour le langage DMX (Data Mining Extensions). DMX a une syntaxe similaire à celle de T-SQL, mais est utilisée pour les requêtes sur les objets d’exploration de données. Bien que la syntaxe DMX ne soit pas compliquée, l’utilisation d’un générateur de requêtes comme celui-ci, ou celle de l’exploration de données SQL Server Add-Ins pour Office, facilite beaucoup la sélection des entrées et des expressions de génération. Nous vous recommandons donc vivement d’apprendre les principes de base.
Création de la requête
La première étape de la création d’une requête de prédiction consiste à sélectionner un modèle d’exploration de données et une table d’entrée.
Pour sélectionner un modèle et une table d’entrée
Sous l’onglet Prédiction du modèle d’exploration de données du Concepteur d’exploration de données, dans la zone Modèle d’exploration de données, cliquez sur Sélectionner un modèle.
Dans la boîte de dialogue Sélectionner un modèle d’exploration de données, naviguez dans l'arborescence jusqu'à la structure Publipostage Ciblé, développez la structure, sélectionnez
TM_Decision_Tree, puis cliquez sur OK.Dans la zone Sélectionner une ou plusieurs tables d’entrée , cliquez sur Sélectionner une table de cas.
Dans la boîte de dialogue Sélectionner une table , dans la liste de sources de données , sélectionnez la vue de source de données Adventure Works DW Multidimensionnel 2012.
Dans Le nom de la table/vue, sélectionnez la table ProspectiveBuyer (dbo), puis cliquez sur OK.
La
ProspectiveBuyertable ressemble le plus étroitement à la table de cas vTargetMail .
Cartographie des colonnes
Après avoir sélectionné la table d’entrée, le Générateur de requêtes de prédiction crée un mappage par défaut entre le modèle d’exploration de données et la table d’entrée, en fonction des noms des colonnes. Au moins une colonne de la structure doit correspondre à une colonne dans les données externes.
Important
Les données que vous utilisez pour déterminer la précision des modèles doivent contenir une colonne qui peut être mappée à la colonne prévisible. Si une telle colonne n’existe pas, vous pouvez en créer une avec des valeurs vides, mais elle doit avoir le même type de données que la colonne prédictible.
Pour mapper les entrées au modèle
Cliquez avec le bouton droit sur les lignes qui connectent la fenêtre Modèle d’exploration de données à la fenêtre Sélectionner une table d’entrée , puis sélectionnez Modifier les connexions.
Notez que toutes les colonnes ne sont pas mappées. Nous allons ajouter des mappages pour plusieurs colonnes de table. Nous allons également générer une nouvelle colonne de date de naissance basée sur la colonne de date actuelle, afin que les colonnes correspondent mieux.
Sous Colonne de tableau, cliquez sur la
Bike Buyercellule et sélectionnez ProspectiveBuyer.Unknown dans la liste déroulante.Cette fonction mappe la colonne prévisible [Bike Buyer] à une colonne de la table d'entrée.
Cliquez sur OK.
Dans l’Explorateur de solutions, cliquez avec le bouton droit sur la vue de source de données Publipostage ciblé , puis sélectionnez Concepteur de vues.
Cliquez avec le bouton droit sur la table, ProspectiveBuyer, puis sélectionnez Nouveau calcul nommé.
Dans la boîte de dialogue Créer un calcul nommé , pour le nom de colonne, tapez
calcAge.Pour Description, tapez Calculer l’âge en fonction de la date de naissance.
Dans la zone Expression , tapez
DATEDIFF(YYYY,[BirthDate],getdate()), puis cliquez sur OK.Étant donné que la table d’entrée n’a pas de colonne Age correspondant à celle du modèle, vous pouvez utiliser cette expression pour calculer l’âge du client à partir de la colonne BirthDate dans la table d’entrée. Étant donné que l’âge a été identifié comme la colonne la plus influente pour prédire l’achat de vélos, il doit exister à la fois dans le modèle et dans la table d’entrée.
Dans le Concepteur d’exploration de données, sélectionnez l’onglet Prédiction du modèle d’exploration de données et rouvrez la fenêtre Modifier les connexions .
Sous Colonne de tableau, cliquez sur la cellule Age et sélectionnez ProspectiveBuyer.calcAge dans la liste déroulante.
Avertissement
Si vous ne voyez pas la colonne dans la liste, vous devrez peut-être actualiser la définition de la vue de source de données chargée dans le concepteur. Pour ce faire, dans le menu Fichier , sélectionnez Enregistrer tout, puis fermez et rouvrez le projet dans le concepteur.
Cliquez sur OK.
Conception de la requête de prédiction
Le premier bouton de la barre d’outils de l’onglet Prédiction du modèle d'exploration de données s'appelle Basculer vers l'affichage création / Basculer vers l'affichage résultat / Basculer vers l'affichage requête. Cliquez sur la flèche vers le bas sur ce bouton, puis sélectionnez Création.
Dans la grille de l’onglet Prédiction du modèle d’exploration de données, cliquez sur la cellule de la première ligne vide de la colonne Source , puis sélectionnez Fonction de prédiction.
Dans la ligne fonction de prédiction , dans la colonne Champ , sélectionnez
PredictProbability.Dans la colonne Alias de la même ligne, tapez Probabilité de résultat.
Dans la fenêtre Modèle d’exploration de données ci-dessus, sélectionnez et faites glisser [Bike Buyer] dans la cellule Critères/Argument .
Quand vous lâchez, [TM_Decision_Tree]. [Bike Buyer] apparaît dans la cellule Critères/Argument .
Cela spécifie la colonne cible de la
PredictProbabilityfonction. Pour plus d’informations sur les fonctions, consultez Informations de référence sur les fonctions DMX (Data Mining Extensions).Cliquez sur la prochaine ligne vide de la colonne Source, puis sélectionnez le modèle d'exploration de données TM_Decision_Tree.
Dans la
TM_Decision_Treeligne, dans la colonne Champ, sélectionnezBike Buyer.Dans la
TM_Decision_Treeligne, dans la colonne Critères/Argument , tapez=1.Cliquez sur la ligne vide suivante dans la colonne Source , puis sélectionnez table ProspectiveBuyer.
Dans la ligne
ProspectiveBuyer, dans la colonne Champ, sélectionnez ProspectiveBuyerKey.Cela ajoute l’identificateur unique à la requête de prédiction afin que vous puissiez identifier qui est et qui n’est pas susceptible d’acheter un vélo.
Ajoutez cinq lignes supplémentaires à la grille. Pour chaque ligne, sélectionnez la table ProspectiveBuyer comme source , puis ajoutez les colonnes suivantes dans les cellules Champ :
calcAge
nom de famille
Prénom
AddressLine1
AddressLine2
Enfin, exécutez la requête et parcourez les résultats.
Le Générateur de requêtes de prédiction inclut également ces contrôles :
Afficher la case à cocher
Vous permet de supprimer des clauses de la requête sans avoir à les supprimer du concepteur. Cela peut être utile lorsque vous travaillez avec des requêtes complexes et que vous souhaitez conserver la syntaxe sans avoir à copier et coller DMX dans la fenêtre.
Groupe
Insère une parenthèse ouvrante (à gauche) au début de la ligne sélectionnée ou insère une parenthèse fermante (droite) à la fin de la ligne active.
ET/OU
Insère l’opérateur
ANDou l’opérateurORimmédiatement après la fonction ou la colonne actuelle.
Pour exécuter la requête et afficher les résultats
Dans l’onglet Prédiction du modèle minier, sélectionnez le bouton Résultat.
Une fois la requête exécutée et les résultats affichés, vous pouvez consulter les résultats.
L’onglet Prédiction du modèle d’exploration de données affiche les informations de contact des clients potentiels susceptibles d’être des acheteurs de vélos. La colonne Probabilité de résultat indique la probabilité que la prédiction soit correcte. Vous pouvez utiliser ces résultats pour déterminer quels clients potentiels cibler pour le publipostage.
À ce stade, vous pouvez enregistrer les résultats. Vous avez trois options :
Cliquez avec le bouton droit sur une ligne de données dans les résultats, puis sélectionnez Copier pour enregistrer cette valeur (et l’en-tête de colonne) dans le Presse-papiers.
Cliquez avec le bouton droit sur une ligne dans les résultats, puis sélectionnez Copier tout pour copier l’ensemble du jeu de résultats, y compris les en-têtes de colonne, dans le Presse-papiers.
Cliquez sur Enregistrer le résultat de la requête pour enregistrer les résultats directement dans une base de données comme suit :
Dans la boîte de dialogue Enregistrer le résultat de la requête d’exploration de données, sélectionnez une source de données ou définissez une nouvelle source de données.
Tapez un nom pour la table qui contiendra les résultats de la requête.
Utilisez l’option Ajouter à DSV pour créer la table et l’ajouter à une vue de source de données existante. Cela est utile si vous souhaitez conserver toutes les tables associées pour un modèle tel que les données d’entraînement, les données sources de prédiction et les résultats de requête dans la même vue de source de données.
Utilisez l’option Remplacer, le cas échéant, pour mettre à jour une table existante avec les résultats les plus récents.
Vous devez utiliser l’option pour remplacer la table si vous avez ajouté des colonnes à la requête de prédiction, modifié les noms ou les types de données des colonnes de la requête de prédiction, ou si vous avez exécuté des instructions ALTER sur la table de destination.
En outre, si plusieurs colonnes ont le même nom (par exemple, l’expression de nom de colonne par défaut) vous devez créer un alias pour les colonnes avec des noms en double, ou une erreur est générée lorsque le concepteur tente d’enregistrer les résultats dans SQL Server. La raison est que SQL Server n’autorise pas plusieurs colonnes à avoir le même nom.
Pour plus d’informations, consultez la boîte de dialogue Enregistrer le résultat de la requête d’exploration de données (la vue prédiction du modèle d’exploration de données).
Tâche suivante de la leçon
Voir aussi
Créer une requête de prédiction à l’aide du Générateur de requêtes de prédiction