Lezione 4: Esplorazione dei modelli di data mining degli acquirenti di biciclette

2017-03-06

In questa lezione si userà l'istruzione SELECT (DMX) per esplorare il contenuto nell'albero delle decisioni e nei modelli di data mining clustering creati nella lezione 2: Aggiunta di modelli di data mining alla struttura di data mining predittiva.

Le colonne contenute in un modello di data mining non sono le colonne definite dalla struttura di data mining, ma sono invece un set specifico di colonne che descrivono le tendenze e i modelli trovati dall'algoritmo. Queste colonne del modello di data mining sono descritte nel set di righe dello schema DMSCHEMA_MINING_MODEL_CONTENT. Ad esempio, la colonna MODEL_NAME nel set di righe dello schema del contenuto contiene il nome del modello di data mining. Per un modello di data mining di clustering, la colonna NODE_CAPTION contiene il nome di ogni cluster e la colonna NODE_DESCRIPTION contiene una descrizione delle caratteristiche di ogni cluster. È possibile esplorare queste colonne utilizzando l'istruzione SELECT FROM <modello>.CONTENT in DMX. È anche possibile utilizzare questa istruzione per esplorare i dati utilizzati per creare il modello di data mining. Per utilizzare questa istruzione, è necessario abilitare il drillthrough nella struttura di mining. Per altre informazioni sull'istruzione, vedere SELECT FROM <modello>.CASES (DMX).

È anche possibile restituire tutti gli stati di una colonna discreta usando l'istruzione SELECT DISTINCT. Ad esempio, se si esegue questa operazione su una colonna gender, la query restituirà male e female.

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

Esplorare il contenuto contenuto contenuto nei modelli di data mining
Restituire i casi dai dati di origine utilizzati per addestrare i modelli di data mining.
Esplorare i diversi stati disponibili per una colonna discreta specifica

Restituzione del contenuto di un modello di data mining

In questa lezione, si usa l'istruzione SELECT FROM< modello>.CONTENT (DMX) per restituire il contenuto del modello di clustering.

Di seguito è riportato un esempio generico dell'istruzione SELECT FROM <model>.CONTENT:

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>

La prima riga del codice definisce le colonne da restituire dal contenuto del modello di data mining e il modello di data mining a cui sono associati:

SELECT <select list> FROM [<mining model].CONTENT

La clausola .CONTENT accanto al nome del modello di data mining specifica che viene restituito il contenuto dal modello di data mining. Per ulteriori informazioni sulle colonne contenute nel modello di data mining, vedere DMSCHEMA_MINING_MODEL_CONTENT Rowset.

Facoltativamente, è possibile usare la riga finale del codice per filtrare i risultati restituiti dall'istruzione :

WHERE <where clause>

Ad esempio, se si desidera limitare i risultati della query solo ai cluster che contengono un numero elevato di case, è possibile aggiungere la clausola WHERE seguente all'istruzione SELECT:

WHERE NODE_SUPPORT > 100

Per altre informazioni sull'uso dell'istruzione WHERE, vedere SELECT (DMX).

Per restituire il contenuto del modello di clustering per data mining

In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

L'editor di query viene aperto e contiene una nuova query vuota.
Copia l'esempio generico dell'istruzione SELECT FROM <modello>.CONTENT nella query vuota.
Sostituire quanto segue:
```
<select list>   
```
con:
```
*  
```
È anche possibile sostituire * con un elenco di qualsiasi colonna contenuta all'interno del set di righe DMSCHEMA_MINING_MODEL_CONTENT.

Sostituire quanto segue:

[<mining model>]

con:

[Clustering]

L'istruzione completa dovrebbe ora essere la seguente:

SELECT * FROM [Clustering].CONTENT

Scegliere Salva DMXQuery1.dmx con nome nel menu File.
Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file SELECT_CONTENT.dmxil nome .
Sulla barra degli strumenti fare clic sul pulsante Esegui .

La query restituisce il contenuto del modello minerario.

Usare il drill-through

Il passaggio successivo consiste nell'usare l'istruzione drill-through per restituire un campionamento dei casi utilizzati per allenare il modello di data mining dell'albero delle decisioni. In questa lezione, userai l'istruzione SELECT FROM <model>.CASES (DMX) per restituire il contenuto del modello ad albero decisionale.

Di seguito è riportato un esempio generico dell'istruzione SELECT FROM <modello>.CASES.

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')

La prima riga del codice definisce le colonne da restituire dai dati di origine e il modello di data mining in cui sono contenuti:

SELECT <select list> FROM [<mining model>].CASES

La clausola .CASES specifica che si sta eseguendo una query drillthrough. Per usare il drillthrough, è necessario abilitarlo al momento della creazione del modello di data mining.

La riga finale del codice è facoltativa e specifica il nodo nel modello di data mining da cui vengono richiesti casi:

WHERE IsInNode('<node id>')

Per ulteriori informazioni sull'uso dell'istruzione WHERE con IsInNode, vedere SELECT FROM <model>.CASES (DMX).

Per restituire i casi utilizzati per addestrare il modello di data mining

In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

L'editor di query viene aperto e contiene una nuova query vuota.
Copia l'esempio generico della dichiarazione SELECT FROM <modello>.CASES nella query vuota.
Sostituire quanto segue:
```
<select list>   
```
con:
```
*  
```
È anche possibile sostituire * con un elenco di qualsiasi colonna contenuta nei dati di origine (ad esempio [Bike Buyer]).

Sostituire quanto segue:

[<mining model>]

con:

[Decision Tree]

L'istruzione completa dovrebbe ora essere la seguente:

SELECT *   
FROM [Decision Tree].CASES

Scegliere Salva DMXQuery1.dmx con nome nel menu File.
Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file SELECT_DRILLTHROUGH.dmxil nome .
Sulla barra degli strumenti fare clic sul pulsante Esegui .

La query restituisce i dati di origine utilizzati per addestrare il modello di albero decisionale per il data mining.

Restituisce gli stati di una colonna del modello di mining discreto

Il passaggio successivo consiste nell'usare l'istruzione SELECT DISTINCT per restituire i diversi stati possibili nella colonna del modello di data mining specificata.

Di seguito è riportato un esempio generico dell'istruzione SELECT DISTINCT:

SELECT DISTINCT [<column>]   
FROM [<mining model>]

La prima riga del codice definisce le colonne del modello di data mining per le quali vengono restituiti gli stati:

SELECT DISTINCT [<column>]

Per restituire tutti gli stati della colonna, è necessario includere DISTINCT. Se si esclude DISTINCT, l'istruzione completa diventa una scorciatoia per una previsione e restituisce lo stato più probabile della colonna specificata. Per altre informazioni, vedere SELECT (DMX).

Per restituire gli stati di una colonna discreta

In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

L'editor di query viene aperto e contiene una nuova query vuota.
Copiare l'esempio generico dell'istruzione SELECT Distinct nella query vuota.
Sostituire quanto segue:
```
[<column,name>   
```
con:
```
[Bike Buyer]  
```

Sostituire quanto segue:

[<mining model>]

con:

[Decision Tree]

L'istruzione completa dovrebbe ora essere la seguente:

SELECT DISTINCT [Bike Buyer]   
FROM [Decision Tree]

Scegliere Salva DMXQuery1.dmx con nome nel menu File.
Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file SELECT_DISCRETE.dmxil nome .
Sulla barra degli strumenti fare clic sul pulsante Esegui .

La query restituisce gli stati possibili della colonna Bike Buyer.

Nella lezione successiva si stima se i potenziali clienti saranno acquirenti di biciclette usando il modello di data mining dell'albero delle decisioni.

Lezione successiva

Lezione 5: Esecuzione di query di stima

Condividi tramite

Lezione 4: Esplorazione dei modelli di data mining degli acquirenti di biciclette

Argomenti della lezione

Restituzione del contenuto di un modello di data mining

Per restituire il contenuto del modello di clustering per data mining

Usare il drill-through

Per restituire i casi utilizzati per addestrare il modello di data mining

Restituisce gli stati di una colonna del modello di mining discreto

Per restituire gli stati di una colonna discreta

Lezione successiva

Risorse aggiuntive