Création de prédictions (Didacticiel sur l'exploration de données de base)

Une fois que vous avez testé la précision de vos modèles d'exploration de données et décidé qu'ils sont satisfaisants, vous pouvez créer des requêtes de prédiction DMX (Data Mining Extensions) en utilisant le Générateur de requêtes de prédiction à partir de l'onglet Prédiction de modèle d'exploration de données dans le Concepteur d'exploration de données.

Le Générateur de requêtes de prédiction a trois vues. Avec les vues Conception et Requête, vous pouvez créer votre requête et l'étudier. Vous pouvez ensuite exécuter la requête et afficher les résultats dans la vue Résultat.

Pour plus d'informations sur l'utilisation du Générateur de requêtes de prédiction, consultez Création de requêtes de prédiction DMX.

Création de la requête

La première étape dans la création d'une requête de prédiction consiste à sélectionner un modèle d'exploration de données et une table d'entrée.

Pour sélectionner un modèle et une table d'entrée

  1. Sous l'onglet Prévision de modèle d'exploration de données du Concepteur d'exploration de données, dans la zone Modèle d'exploration de données, cliquez sur Sélectionner un modèle.

  2. Dans la boîte de dialogue Sélectionner un modèle d'exploration de données, parcourez l'arborescence jusqu'à la structure Publipostage ciblé, développez la structure, sélectionnez TM_Decision_Tree, puis cliquez sur OK.

  3. Dans la zone Sélectionner une ou plusieurs tables d'entrée, cliquez sur Sélectionner la table de cas.

  4. Dans la boîte de dialogue Sélectionner une table, dans la liste Source de données, sélectionnez Adventure Works DW2008R2.

  5. Dans Nom de la table/vue, sélectionnez la table ProspectiveBuyer (dbo), puis cliquez sur OK.

    La table ProspectiveBuyer ressemble étroitement à la table de cas vTargetMail.

Mappage des colonnes

Une fois la table d'entrée sélectionnée, le Générateur de requête de prévision crée un mappage par défaut entre le modèle d'exploration de données et la table d'entrée sur la base des noms des colonnes. Au moins une colonne de la structure doit correspondre à une colonne dans les données externes.

Important

Les données que vous utilisez pour déterminer la précision des modèles doivent contenir une colonne qui peut être mappée à la colonne prédictible.

Pour mapper les colonnes de structure aux colonnes de la table d'entrée

  1. Cliquez avec le bouton droit sur les lignes qui connectent la fenêtre Modèle d'exploration de données à la fenêtre Sélectionner une ou plusieurs tables d'entrée et sélectionnez Modifier les connexions.

    Vous remarquez que toutes les colonnes ne sont pas mappées. Nous allons ajouter des mappages pour plusieurs Colonnes de la table.

  2. Sous Colonne de table, cliquez sur la cellule Bike Buyer et sélectionnez ProspectiveBuyer.Unknown dans la liste déroulante.

    Cette action mappe la colonne prédictible, [Bike Buyer], à une colonne de la table d'entrée.

  3. Cliquez sur OK.

  4. Dans l'Explorateur de solutions, cliquez avec le bouton droit sur la vue de source de données Publipostage ciblé et sélectionnez Générateur de vues.

  5. Cliquez avec le bouton droit sur le titre de la table ProspectiveBuyer et sélectionnez Nouveau calcul nommé.

  6. Dans la zone Nom de la colonne, tapez calcAge.

  7. Dans la zone Expression, tapez DATEDIFF(YYYY,[BirthDate],getdate()), puis cliquez sur OK.

    La table d'entrée n'a aucune colonne Age correspondante. Cette expression calcule l'âge du client dans la colonne de table d'entrée BirthDate. Comme Age a été identifiée comme la colonne la plus influente pour prédire l'achat d'un vélo, elle doit figurer à la fois dans la table d'entrée et dans le modèle.

  8. Dans le Concepteur d'exploration de données, sélectionnez l'onglet Prédiction de modèle d'exploration de données et rouvrez la fenêtre Modifier les connexions.

  9. Sous Colonne de table, cliquez sur la cellule Age et sélectionnez ProspectiveBuyer.calcAge à partir de la liste déroulante.

  10. Cliquez sur OK.

Conception de la requête de prédiction

Pour concevoir la requête de prédiction

  1. Le premier bouton dans la barre d'outils de l'onglet Prévision de modèle d'exploration de données est le bouton Basculer en mode Conception / Basculer vers l'affichage du résultat de la requête / Basculer vers l'affichage de la requête. Cliquez sur la flèche vers le bas sur ce bouton et sélectionnez Conception.

  2. Dans la grille située dans l'onglet Prévision de modèle d'exploration de données, cliquez dans la cellule de la première ligne vide dans la colonne Source puis sélectionnez Fonction de prédiction.

    Ceci permet de spécifier la colonne cible pour la fonction PredictProbability. Pour plus d'informations sur ces fonctions, consultez Fonctions DMX (Data Mining Extensions).

  3. Dans la ligne Prediction Function et la colonne Champ, vérifiez si PredictProbability est sélectionné.

  4. Dans la fenêtre Modèle d'exploration de données au-dessus, sélectionnez et faites glisser [Bike Buyer] dans la cellule Critères/Argument.

    Lorsque vous relâchez, [TM_Decision_Tree].[Bike Buyer] s'affiche dans la cellule Critères/Argument.

  5. Cliquez dans la ligne vide suivante de la colonne Source, puis sélectionnez TM_Decision_Tree.

  6. Dans la ligne TM_Decision_Tree et la colonne Champ, sélectionnez Bike Buyer.

  7. Dans la ligne TM_Decision_Tree, dans la colonne Critères/Argument, tapez =1.

  8. Cliquez dans la ligne vide suivante de la colonne Source, puis sélectionnez ProspectiveBuyer.

  9. Dans la ligne ProspectiveBuyer et la colonne Champ, sélectionnez ProspectiveBuyerKey.

    Un identificateur unique est ainsi ajouté à la requête de prédiction, lequel vous permet d'identifier les personnes susceptibles ou non d'acheter un vélo.

  10. Ajoutez cinq lignes en plus à la grille. Pour chaque ligne, sélectionnez ProspectiveBuyer comme la Source puis ajoutez les colonnes suivantes dans les cellules Champ :

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Enfin, exécutez la requête et consultez les résultats.

Pour exécuter la requête et afficher les résultats

  1. Sous l'onglet Prévision de modèle d'exploration de données, sélectionnez le bouton Résultat.

  2. Après l'exécution de la requête et l'affichage des résultats, vous pouvez examiner les résultats.

    L'onglet Prévision de modèle d'exploration de données affiche des informations de contact pour les clients potentiels susceptibles d'acheter des vélos. La colonne Expression indique le degré d'exactitude de la prédiction. Ces résultats peuvent vous aider à déterminer les clients potentiels à cibler pour le publipostage.

  3. Cliquez sur Enregistrer pour enregistrer les résultats.