Partager via


Création de la structure d’un modèle d'exploration de données pour le publipostage ciblé (guide de base sur l’exploration de données)

La première étape de la création d’un scénario de publipostage ciblé consiste à utiliser l’Assistant Exploration de données dans SQL Server Data Tools (SSDT) pour créer une nouvelle structure d’exploration de données et un modèle d’exploration de données d’arbre de décision.

Dans cette tâche, vous allez configurer une nouvelle structure d’exploration de données et ajouter un modèle d’exploration de données initial basé sur l’algorithme Microsoft Decision Trees. Pour créer la structure, vous allez d’abord sélectionner des tables et des vues, puis identifier les colonnes qui seront utilisées pour l’entraînement et celles à tester.

Pour créer une structure d’exploration de données pour le scénario de publipostage ciblé

  1. Dans l’Explorateur de solutions, cliquez avec le bouton droit sur Structures d’exploration de données et sélectionnez Nouvelle structure d’exploration de données pour démarrer l’Assistant Exploration de données.

  2. Dans la page Bienvenue dans l’Assistant Exploration de données , cliquez sur Suivant.

  3. Dans la page Sélectionner la méthode de définition, vérifiez que À partir d’une base de données relationnelle ou d’un entrepôt de données existant est sélectionné, puis cliquez sur Suivant.

  4. Dans la page Créer la structure d’exploration de données , sous Quelle technique d’exploration de données voulez-vous utiliser ?, sélectionnez Arbres de décision Microsoft.

    Remarque

    Si vous recevez un avertissement indiquant qu’aucun algorithme d’exploration de données n’est disponible, les propriétés du projet peuvent ne pas être configurées correctement. Cet avertissement se produit lorsque le projet tente de récupérer une liste d’algorithmes d’exploration de données à partir du serveur Analysis Services et ne peut pas trouver le serveur. Par défaut, SQL Server Data Tools utilise localhost comme serveur. Si vous utilisez une autre instance ou une instance nommée, vous devez modifier les propriétés du projet. Pour plus d’informations, consultez Création d’un projet Analysis Services (didacticiel d’exploration de données de base).

  5. Cliquez sur Suivant.

  6. Dans la page Sélectionner une vue de source de données , dans le volet Affichages sources de données disponibles , sélectionnez Publipostage ciblé. Vous pouvez cliquer sur Parcourir pour afficher les tables dans la vue des sources de données, puis cliquer sur Fermer pour revenir à l’Assistant.

  7. Cliquez sur Suivant.

  8. Dans la page Spécifier les types de tables, cochez la case dans la colonne Case de vTargetMail pour l’utiliser comme table de cas, puis cliquez sur Suivant. Vous utiliserez la table ProspectiveBuyer ultérieurement pour les tests ; ignorez-le pour l’instant.

  9. Dans la page Spécifier les données d’entraînement , vous identifierez au moins une colonne prédictible, une colonne clé et une colonne d’entrée pour votre modèle. Cochez la case dans la colonne Prédictible de la ligne BikeBuyer .

    Remarque

    Notez l’avertissement en bas de la fenêtre. Vous ne pourrez pas accéder à la page suivante tant que vous n’aurez pas sélectionné au moins une entrée et une colonne prédictible .

  10. Cliquez sur Suggérer pour ouvrir la boîte de dialogue Suggérer des colonnes associées .

    Le bouton Suggérer est activé chaque fois qu’au moins un attribut prédictible a été sélectionné. La boîte de dialogue Suggérer des colonnes associées répertorie les colonnes les plus étroitement liées à la colonne prédictible et trie les attributs par leur corrélation avec l’attribut prédictible. Les colonnes avec une corrélation significative (confiance supérieure à 95%) sont automatiquement sélectionnées pour être incluses dans le modèle.

    Passez en revue les suggestions, puis cliquez sur Annuler pour ignorer les suggestions.

    Remarque

    Si vous cliquez sur OK, toutes les suggestions répertoriées seront marquées comme colonnes d'entrée dans l'Assistant. Si vous acceptez uniquement certaines des suggestions, vous devez modifier les valeurs manuellement.

  11. Vérifiez que la case à cocher dans la colonne Clé est cochée dans la ligne CustomerKey .

    Remarque

    Si la table source de la vue de source de données indique une clé, l’Assistant Exploration de données choisit automatiquement cette colonne comme clé pour le modèle.

  12. Cochez les cases de la colonne Entrée dans les lignes suivantes. Vous pouvez cocher plusieurs colonnes en mettant en surbrillance une plage de cellules et en appuyant sur Ctrl lors de la sélection d’une case à cocher.

    • Âge

    • CommuteDistance

    • EnglishEducation

    • OccupationAnglaise

    • Genre

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NombreEnfantsÀLaMaison

    • Région

    • TotalChildren

    • AnnuelIncome

  13. Dans la colonne de gauche de la page, activez les cases à cocher dans les lignes suivantes.

    • AddressLine1

    • AddressLine2

    • DatePremierAchat

    • EmailAddress

    • FirstName

    • LastName

    Vérifiez que ces lignes ont des vérifications uniquement dans la colonne gauche. Ces colonnes seront ajoutées à votre structure, mais ne seront pas incluses dans le modèle. Toutefois, une fois le modèle généré, ils seront disponibles pour l'exploration détaillée et le test. Pour plus d’informations sur le forage, consultez Requêtes de forage (exploration de données)

  14. Cliquez sur Suivant.

Tâche suivante de la leçon

Spécification du type de données et du type de contenu (didacticiel d’exploration de données de base)

Voir aussi

Spécifier les types des tables (Assistant Exploration de données)
Concepteur d’exploration de données
Algorithme d’arbres de décision Microsoft