Partager via


Leçon 4 : Exploration des modèles d’exploration de données Bike Buyer

Dans cette leçon, vous allez utiliser l’instruction SELECT (DMX) pour explorer le contenu de l’arbre de décision et clustering modèles d’exploration de données que vous avez créés dans leçon 2 : Ajout de modèles d’exploration de données à la structure d’exploration de données prédictive.

Les colonnes figurant dans un modèle d'exploration de données ne sont pas les colonnes définies par la structure d'exploration de données ; elles forment plutôt un ensemble spécifique de colonnes décrivant des tendances et des modèles identifiés par l'algorithme. Ces colonnes de modèle d’exploration de données sont décrites dans l’ensemble de lignes DMSCHEMA_MINING_MODEL_CONTENT schéma d’ensemble de lignes. Par exemple, la colonne MODEL_NAME située dans l'ensemble de lignes du schéma contient le nom du modèle d'exploration de données. Dans le cadre d'un modèle d'exploration de données clustering, la colonne NODE_CAPTION renferme le nom de chaque cluster et la colonne NODE_DESCRIPTION contient une description des caractéristiques de chacun de ces clusters. Vous pouvez parcourir ces colonnes à l’aide du modèle> SELECT FROM<. Instruction CONTENT dans DMX. Le recours à cette instruction est également possible si vous souhaitez explorer les données utilisées pour la création du modèle d'exploration de données. Pour utiliser cette instruction, vous devez activer la fonction d'extraction dans la structure d'exploration de données. Pour plus d’informations sur l’instruction, consultez MODÈLE SELECT FROM<>. CAS (DMX).

Vous pouvez également afficher tous les états d'une colonne discrète par le biais de l'instruction SELECT DISTINCT. Par exemple, si vous effectuez cette opération sur une colonne Sexe, la requête retourne les valeurs male et female.

Tâches de la leçon

Vous allez effectuer les tâches suivantes dans cette leçon :

  • explorer le contenu des modèles d'exploration de données ;

  • retourner les cas des données source utilisées pour l'apprentissage des modèles d'exploration de données ;

  • explorer les différents états disponibles pour une colonne discrète donnée.

Retour du contenu d'un modèle d'exploration de données

Dans cette leçon, vous utilisez le modèle> SELECT FROM<. INSTRUCTION CONTENT (DMX) pour renvoyer le contenu du modèle clustering.

Voici un exemple générique du modèle> SELECT FROM<. INSTRUCTION CONTENT :

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

La première ligne du code définit les colonnes à retourner à partir du contenu du modèle d'exploration de données et le modèle d'exploration de données auquel elles sont associées :

SELECT <select list> FROM [<mining model].CONTENT  

La clause .CONTENT en regard du nom du modèle d'exploration de données précise que le contenu est retourné à partir du modèle d'exploration de données. Pour plus d’informations sur les colonnes contenues dans le modèle d’exploration de données, consultez DMSCHEMA_MINING_MODEL_CONTENT Ensemble de lignes.

Vous pouvez éventuellement exploiter la dernière ligne du code pour filtrer les résultats retournés par l'instruction :

WHERE <where clause>  

Par exemple, si vous souhaitez restreindre les résultats de la requête uniquement aux clusters abritant un grand nombre de cas, vous pouvez ajouter la clause WHERE suivante à l'instruction SELECT :

WHERE NODE_SUPPORT > 100  

Pour plus d’informations sur l’utilisation de l’instruction WHERE, consultez SELECT (DMX).

Pour retourner le contenu du modèle d'exploration de données clustering

  1. Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l’exemple générique du modèle> SELECT FROM<. Instruction CONTENT dans la requête vide.

  3. Remplacez le code suivant :

    <select list>   
    

    par :

    *  
    

    Vous pouvez également remplacer * par une liste de l’une des colonnes contenues dans l’ensemble de lignes DMSCHEMA_MINING_MODEL_CONTENT.

  4. Remplacez le code suivant :

    [<mining model>]   
    

    par :

    [Clustering]  
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT * FROM [Clustering].CONTENT  
    
  5. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_CONTENT.dmx.

  7. Dans la barre d’outils, cliquez sur le bouton Exécuter .

    La requête retourne le contenu du modèle d'exploration de données.

Utilisation de la fonction d'extraction

L'étape suivante consiste à utiliser l'instruction d'extraction pour retourner un éventail de cas utilisés pour l'apprentissage du modèle d'exploration de données d'arbre de décision. Dans cette leçon, vous utilisez le modèle> SELECT FROM<. Instruction CASES (DMX) pour renvoyer le contenu du modèle d’arbre de décision.

Voici un exemple générique du modèle> SELECT FROM<. Instruction CASES :

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

La première ligne du code définit les colonnes à retourner depuis les données source et le modèle d'exploration de données qui les contient :

SELECT <select list> FROM [<mining model>].CASES  

La clause .CASES indique que vous exécutez une requête d'extraction. Pour recourir à l'extraction, vous devez l'activer au moment de créer le modèle d'exploration de données.

La dernière ligne de code est facultative et spécifie le nœud du modèle d'exploration de données duquel vous souhaitez obtenir les cas :

WHERE IsInNode('<node id>')  

Pour plus d’informations sur l’utilisation de l’instruction WHERE avec IsInNode, consultez modèle> SELECT FROM<. CAS (DMX).

Pour retourner les cas utilisés pour l'apprentissage du modèle d'exploration de données

  1. Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l’exemple générique du modèle> SELECT FROM<. Instruction CASES dans la requête vide.

  3. Remplacez le code suivant :

    <select list>   
    

    par :

    *  
    

    Vous pouvez remplacer * par une liste de colonnes issues des sources de données (par exemple, [Bike Buyer]).

  4. Remplacez le code suivant :

    [<mining model>]   
    

    par :

    [Decision Tree]  
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT *   
    FROM [Decision Tree].CASES  
    
  5. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_DRILLTHROUGH.dmx.

  7. Dans la barre d’outils, cliquez sur le bouton Exécuter .

    La requête retourne les données source utilisées pour l'apprentissage du modèle d'exploration de données d'arbre de décision.

Retour des états d'une colonne discrète du modèle d'exploration de données

L'étape suivante consiste à utiliser l'instruction SELECT DISTINCT pour retourner les différents états possibles dans la colonne de modèle d'exploration de données spécifiée.

L'exemple générique suivant utilise l'instruction SELECT DISTINCT :

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

La première ligne du code définit les colonnes du modèle d'exploration de données pour lesquelles les états sont retournés :

SELECT DISTINCT [<column>]   

Vous devez inclure l'instruction DISTINCT pour être en mesure de retourner tous les états de la colonne. Si vous l'excluez, l'instruction DISTINCT complète se transforme en un raccourci de création de prédiction et retourne l'état le plus probable de la colonne spécifiée. Pour plus d’informations, consultez SELECT (DMX).

Pour retourner les états d'une colonne discrète

  1. Dans Explorateur d'objets, cliquez avec le bouton droit sur le instance d’Analysis Services, pointez sur Nouvelle requête, puis cliquez sur DMX.

    L'Éditeur de requête s'ouvre et contient une nouvelle requête vide.

  2. Copiez l'exemple générique de l'instruction SELECT DISTINCT dans la requête vide.

  3. Remplacez le code suivant :

    [<column,name>   
    

    par :

    [Bike Buyer]  
    
  4. Remplacez le code suivant :

    [<mining model>]   
    

    par :

    [Decision Tree]  
    

    L'instruction tout entière doit se présenter comme suit :

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  5. Dans le menu Fichier , cliquez sur Enregistrer DMXQuery1.dmx sous.

  6. Dans la boîte de dialogue Enregistrer sous, accédez au dossier approprié et nommez le fichier SELECT_DISCRETE.dmx.

  7. Dans la barre d’outils, cliquez sur le bouton Exécuter .

    La requête retourne les états possibles de la colonne Bike Buyer.

Au cours de la leçon suivante, vous allez évaluer si des clients potentiels sont des acheteurs de vélos à l'aide du modèle d'exploration de données d'arbre de décision.

Leçon suivante

Leçon 5 : Exécution des requêtes de prédiction