Partager via


Création de prédictions sur un modèle de clustering de séquences (didacticiel sur l’exploration de données intermédiaire)

Une fois que vous avez mieux compris le modèle de regroupement de séquences en le consultant dans le visualiseur, vous pouvez créer des requêtes de prédiction à l’aide du Générateur de requêtes de prédiction dans l’onglet Prédiction du modèle d’exploration de données dans le Concepteur d’exploration de données. Pour créer une prédiction, vous sélectionnez d’abord le modèle de clustering de séquences, puis sélectionnez les données d’entrée. Pour les entrées, vous pouvez utiliser une source de données externe ou générer une requête singleton et fournir des valeurs dans une boîte de dialogue.

Cette leçon suppose que vous connaissez déjà l’utilisation du générateur de requêtes de prédiction et que vous souhaitez apprendre à générer des requêtes spécifiques à un modèle de clustering de séquence. Pour plus d’informations sur l’utilisation du Générateur de requêtes de prédiction, consultez les interfaces de requête d’exploration de données ou la section du didacticiel d’exploration de données de base, Création de prédictions (didacticiel d’exploration de données de base).

Création de prédictions sur le modèle régional

Pour ce scénario, vous allez d’abord créer des requêtes de prédiction singleton pour avoir une idée de la façon dont les prédictions peuvent être différentes par région.

Pour créer une requête singleton sur un modèle de clustering de séquences

  1. Cliquez sur l’onglet Prédiction du modèle d’exploration dans le Concepteur d’exploration de données.

  2. Dans le menu de colonne Modèle d’exploration de données, sélectionnez Requête Singleton.

    Le volet Modèle d’exploration de données et le volet Entrée de requête Singleton s’affichent.

  3. Dans le volet Modèle d’exploration, cliquez sur Sélectionner le modèle. (Vous pouvez ignorer cette étape si le mode de clustering de séquence est déjà sélectionné.)

    La boîte de dialogue Sélectionner un modèle d’exploration de données s’ouvre.

  4. Développez le nœud qui représente la structure minière Clustering de séquences avec région, puis sélectionnez le modèle Clustering de séquences avec région. Cliquez sur OK. Pour l’instant, ignorez le volet d’entrée ; vous spécifiez les entrées après avoir configuré les fonctions de prédiction.

  5. Dans la grille, cliquez sur la cellule vide sous Source et sélectionnez Fonction de prédiction. Dans la cellule sous Champ, sélectionnez PredictSequence.

    Remarque

    Vous pouvez également utiliser la fonction Predict . Si vous le faites, veillez à choisir la version de la fonction Predict qui prend une colonne de table en tant qu’argument..

  6. Dans le volet Modèle d’exploration de données, sélectionnez la table v Assoc Seq Line Items imbriquée, puis faites-la glisser dans la grille, dans la boîte Critères/Argument pour la fonction PredictSequence.

    Le glisser-déplacer des noms de tables et de colonnes vous permet de générer des instructions complexes sans erreurs de syntaxe. Toutefois, il remplace le contenu actuel de la cellule, qui inclut d’autres arguments facultatifs pour la fonction PredictSequence . Pour afficher les autres arguments, vous pouvez ajouter temporairement une deuxième instance de la fonction à la grille pour référence.

  7. Cliquez sur le bouton Résultat dans le coin supérieur du Générateur de requêtes de prédiction.

Les résultats attendus contiennent une seule colonne avec l’expression d’en-tête. La colonne Expression contient une table imbriquée avec trois colonnes comme suit :

$SEQUENCE Numéro de ligne Modèle
1 Montagne-200

Que signifient ces résultats ? N’oubliez pas que vous n’avez pas spécifié d’entrées. Par conséquent, la prédiction est effectuée par rapport à l’ensemble de la population des cas, et Analysis Services retourne la prédiction la plus probable dans l’ensemble.

Ajout d’entrées à une requête de prédiction Singleton

Jusqu’à présent, vous n’avez pas spécifié d’entrées. Dans la tâche suivante, vous allez utiliser le volet Entrée de requête Singleton pour spécifier certaines entrées dans la requête. Tout d’abord, vous allez utiliser [Région] comme entrée du modèle de clustering de séquences régionales pour déterminer si les séquences prédites sont identiques pour toutes les régions. Vous allez ensuite apprendre à modifier la requête pour ajouter la probabilité pour chaque prédiction et aplatir les résultats pour les rendre plus faciles à afficher.

Pour générer des prédictions pour un groupe de clients spécifique
  1. Cliquez sur le bouton Création dans le coin supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de construction de requêtes.

  2. Dans la boîte de dialogue Entrée de requête Singleton , cliquez sur la zone Valeur pour Region, puis sélectionnez Europe.

  3. Cliquez sur le bouton Résultat pour afficher les prédictions des clients en Europe.

  4. Cliquez sur le bouton Création dans le coin supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de construction de requêtes.

  5. Dans la boîte de dialogue Entrée de requête Singleton , cliquez sur la zone Valeur pour Region, puis sélectionnez Amérique du Nord.

  6. Cliquez sur le bouton Résultat pour afficher les prédictions des clients en Amérique du Nord.

Ajout de probabilités à l’aide d’une expression personnalisée

Pour générer la probabilité de chaque prédiction est légèrement plus complexe, car la probabilité est un attribut de la prédiction et est sortie sous forme de table imbriquée. Si vous connaissez les extensions d’exploration de données (DMX), vous pouvez facilement modifier la requête pour ajouter une instruction de sous-sélection sur la table imbriquée. Toutefois, vous pouvez également créer une instruction de sous-sélection dans le Générateur de requêtes de prédiction en ajoutant une expression personnalisée.

Pour générer des probabilités pour une séquence prédite à l’aide d’une expression personnalisée
  1. Cliquez sur le bouton Création dans le coin supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de construction de requêtes.

  2. Dans la grille, sous Source, cliquez sur une nouvelle ligne, puis sélectionnez Expression personnalisée.

  3. Laissez la case sous Champ vide.

  4. Pour Alias, tapez t.

  5. Dans la zone Critères/Argument , tapez l’instruction de sous-sélection complète, comme indiqué dans l’exemple de code suivant. Veillez à inclure les parenthèses de début et de fin.

    (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
    
  6. Cliquez sur le bouton Résultat pour afficher les prédictions des clients en Europe.

Les résultats contiennent désormais deux tables imbriquées, une avec la prédiction et une avec la probabilité de la prédiction. Si la requête ne fonctionne pas, vous pouvez basculer vers l’affichage création de requête et passer en revue l’instruction de requête complète, qui doit être la suivante :

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t  

Utilisation des résultats

Lorsqu’il existe de nombreuses tables imbriquées dans les résultats, vous pouvez aplatir les résultats pour faciliter l’affichage. Pour ce faire, vous pouvez modifier manuellement la requête et ajouter le FLATTENED mot clé.

Pour aplatir les ensembles de lignes imbriqués dans une requête de prédiction
  1. Cliquez sur le bouton Requête dans le coin du Générateur de requêtes de prédiction.

    La grille passe à un volet ouvert dans lequel vous pouvez afficher et modifier l’instruction DMX créée par le Générateur de requêtes de prédiction.

  2. Après le SELECT mot clé, tapez FLATTENED.

    Le texte complet de la requête doit être similaire à ce qui suit :

    SELECT FLATTENED  
      PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
      ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
    FROM  
      [Sequence Clustering with Region]  
    NATURAL PREDICTION JOIN  
    (SELECT 'Europe' AS [Region]) AS t  
    
  3. Cliquez sur le bouton Résultats dans le coin supérieur du Générateur de requêtes de prédiction.

Une fois que vous avez modifié manuellement une requête, vous ne pourrez pas revenir en mode Création sans perdre les modifications. Toutefois, vous pouvez enregistrer l’instruction DMX que vous avez créée manuellement dans un fichier texte, puis revenir en mode Création. Lorsque vous le faites, la requête est rétablie à la dernière version valide en mode Création.

Les exemples précédents utilisaient une colonne de table de cas, Region, comme entrée dans la requête de prédiction singleton, car vous souhaitiez savoir si le modèle avait trouvé des différences entre les régions. Toutefois, après avoir exploré le modèle, vous avez décidé que les différences ne sont pas suffisantes pour justifier la personnalisation des recommandations de produit par région. Ce que vous êtes vraiment intéressé par la prédiction est les éléments que les clients sélectionnent. Par conséquent, dans les requêtes qui suivent, vous allez utiliser le modèle de clustering séquence qui n’inclut pas la région, pour générer des recommandations pour tous les clients.

Utilisation de colonnes de table imbriquées comme entrée

Tout d’abord, vous allez créer une requête de prédiction singleton qui accepte un seul élément comme entrée et retourne l’élément le plus probable suivant. Pour obtenir une prédiction de ce type, vous devez utiliser une colonne de table imbriquée comme valeur d’entrée. Cela est dû au fait que l’attribut que vous prévoyez, Model, fait partie d’une table imbriquée. Analysis Services fournit la boîte de dialogue Entrée de table imbriquée pour vous aider à créer facilement des requêtes de prédiction sur des attributs de table imbriqués à l’aide du Générateur de requêtes de prédiction.

Pour utiliser une table imbriquée comme entrée à une prédiction
  1. Cliquez sur le bouton Création dans le coin supérieur gauche du Générateur de requêtes de prédiction pour revenir à la grille de création de requêtes.

  2. Dans la boîte de dialogue Entrée de requête Singleton , cliquez sur la zone Valeur pour Region, puis sélectionnez la ligne vide pour effacer l’entrée de ce champ.

  3. Dans la boîte de dialogue Entrée de requête Singleton , cliquez sur la zone Valeur pour vAssocSeqLineItems, puis cliquez sur le bouton (...) .

  4. Dans la boîte de dialogue Entrée de table imbriquée , cliquez sur Ajouter.

  5. Dans la nouvelle ligne, cliquez sur la zone sous Model, puis sélectionnez Touring Tire dans la liste. Cliquez sur OK.

  6. Cliquez sur le bouton Résultat pour afficher les prédictions.

Le modèle recommande les éléments suivants pour tous les clients qui choisissent le tire de tourisme comme premier élément. Vous savez déjà à partir de l’exploration du modèle que les clients achètent fréquemment les produits Touring Tire et Touring Tire Tube ensemble, donc ces recommandations semblent bonnes.

$SEQUENCE Numéro de ligne Modèle
1 Tube de pneus de tournée
2 Sport-100
3 Long-Sleeve Logo Maillot

Création d’une requête de prédiction en bloc à l’aide d’entrées de table imbriquées

Maintenant que vous êtes satisfait que le modèle crée le type de prédictions que vous pouvez utiliser pour effectuer des recommandations, vous allez créer une requête de prédiction mappée à une source de données externe. Cette source de données fournit des valeurs représentant les produits actuels. Étant donné que vous souhaitez créer une requête de prédiction qui fournit l’ID client et une liste de produits comme entrée, vous allez ajouter la table client comme table de cas et la table d’achats comme table imbriquée. Ensuite, vous allez ajouter des fonctions de prédiction comme vous l’avez fait précédemment pour créer des recommandations.

Il s’agit de la même procédure que celle que vous utilisez pour créer des prédictions pour le scénario de panier de marché dans la leçon 3 ; Toutefois, dans une prédiction de modèle de clustering de séquences, vous avez également besoin de l’ordre d’entrée.

Pour créer une requête de prédiction à l’aide d’entrées de table imbriquées
  1. Dans le volet Modèle d’exploration de données, sélectionnez le modèle Sequence Clustering, s’il n’est pas déjà sélectionné.

  2. Dans la boîte de dialogue Sélectionner une ou plusieurs tables d’entrée , cliquez sur Sélectionner une table de cas.

  3. Dans la boîte de dialogue Sélectionner une table, pour la Source de Données, sélectionnez Commandes. Dans la liste Nom du tableau/affichage , sélectionnez vAssocSeqOrders, puis cliquez sur OK.

  4. Dans la boîte de dialogue Sélectionner une ou plusieurs tables d’entrée , cliquez sur Sélectionner une table imbriquée.

  5. Dans la boîte de dialogue Sélectionner une table , pour la source de données, sélectionnez Commandes. Dans la liste des noms de table/affichage , sélectionnez vAssocSeqLineItems, puis cliquez sur OK.

    Analysis Services essaiera de détecter les relations et de les créer automatiquement si les types de données correspondent et que les noms de colonnes sont similaires. Si les relations qu’il crée sont incorrectes, vous pouvez cliquer avec le bouton droit sur la ligne de jointure et sélectionner Modifier les connexions pour modifier le mappage de colonnes, ou cliquer avec le bouton droit sur la ligne de jointure et sélectionner Supprimer pour supprimer complètement la relation. Dans ce cas, étant donné que les tables ont déjà été jointes dans la vue de source de données, ces relations sont automatiquement ajoutées au volet création.

  6. Ajoutez une nouvelle ligne à la grille. Pour Source, sélectionnez vAssocSeqOrders, puis, pour Field, sélectionnez CustomerKey.

  7. Ajoutez une nouvelle ligne à la grille. Pour Source, sélectionnez Fonction de prédiction et pour Champ, sélectionnez PredictSequence.

  8. Faites glisser vAssocSeqLineItems dans la zone Critères/Argument . Cliquez à la fin de la zone Critères/Arguments , puis tapez les arguments suivants : 2.

    Le texte complet de la zone Critères/Arguments doit être : [Sequence Clustering].[v Assoc Seq Line Items],2

  9. Cliquez sur le bouton Résultat pour afficher les prédictions pour chaque client.

Vous avez terminé le tutoriel sur les modèles de clustering de séquences.

Étapes suivantes

Si vous avez terminé toutes les sections du didacticiel d’exploration de données intermédiaire (Analysis Services - Exploration de données), l’étape suivante peut être d’apprendre à utiliser des instructions DMX (Data Mining Extensions) pour générer des modèles et générer des prédictions. Pour plus d’informations, consultez Création et interrogation de modèles d’exploration de données avec DMX : Tutoriels (Analysis Services - Exploration de données).

Si vous êtes familiarisé avec les concepts de programmation, vous pouvez également utiliser Analysis Management Objects (AMO) pour travailler par programmation avec des objets d’exploration de données. Pour plus d’informations, consultez Classes d’exploration de données AMO.

Voir aussi

Exemples de requêtes sur des modèles de clustering de séquence
Contenu du modèle d'exploration de données des modèles de clustering de séquences (Services d'analyse - Exploration de données)