Condividi tramite


Esplorazione del modello decision tree (esercitazione di base sul data mining)

L'algoritmo Microsoft Decision Trees consente di stimare le colonne che influenzano la decisione di acquistare una bicicletta in base alle colonne rimanenti nel set di training.

Scheda Albero delle decisioni

Nella scheda Albero delle decisioni è possibile visualizzare gli alberi delle decisioni per ogni attributo stimabile nel set di dati.

In questo caso, il modello stima una sola colonna, Bike Buyer, quindi è presente un solo albero da visualizzare. Se sono presenti più alberi, è possibile usare la casella Albero per scegliere un altro albero.

Quando si visualizza il TM_Decision_Tree modello nel visualizzatore Albero delle decisioni, è possibile visualizzare gli attributi più importanti sul lato sinistro del grafico. "Più importante" significa che questi attributi hanno la maggiore influenza sul risultato. Gli attributi più in basso nell'albero (a destra del grafico) hanno meno di un effetto.

In questo esempio, l'età è l'unico fattore più importante nella previsione dell'acquisto di biciclette. Il modello raggruppa i clienti in base all'età e quindi mostra l'attributo più importante successivo per ogni fascia di età. Ad esempio, nel gruppo di clienti di età compresa tra 34 e 40 anni, il numero di automobili di proprietà è il più forte stimatore dopo l'età.

Per esplorare il modello nella scheda Albero delle decisioni

  1. Selezionare la scheda Mining Model Viewer in Data Mining Designer.

    Per impostazione predefinita, la finestra di progettazione apre il primo modello aggiunto alla struttura— in questo caso, TM_Decision_Tree.

  2. Usare i pulsanti della lente di ingrandimento per regolare le dimensioni della visualizzazione dell'albero.

    Per impostazione predefinita, Microsoft Tree Viewer mostra solo i primi tre livelli dell'albero. Se l'albero contiene meno di tre livelli, il visualizzatore visualizza solo i livelli esistenti. È possibile visualizzare più livelli usando il dispositivo di scorrimento Mostra livello o l'elenco Espansione predefinita .

  3. Fai scorrere Mostra Livello fino alla quarta barra.

  4. Modificare il valore background in 1.

    Modificando l'impostazione Sfondo, è possibile visualizzare rapidamente il numero di casi in ogni nodo che hanno il valore target di 1 per [Bike Buyer]. Tenere presente che in questo scenario specifico ogni caso rappresenta un cliente. Il valore 1 indica che il cliente ha acquistato in precedenza una bicicletta. Il valore 0 indica che il cliente non ha acquistato una bicicletta. Più scura è l'ombreggiatura del nodo, maggiore è la percentuale di casi nel nodo con il valore di destinazione.

  5. Posizionare il cursore sul nodo con etichetta Tutto. Un tooltip visualizzerà le seguenti informazioni:

    • Numero totale di casi

    • Numero di casi non acquirenti di biciclette

    • Numero di casi di acquirenti di biciclette

    • Numero di casi con valori mancanti per [Bike Buyer]

    In alternativa, posizionare il cursore su qualsiasi nodo nell'albero per visualizzare la condizione necessaria per raggiungere tale nodo dal nodo che viene prima. È anche possibile visualizzare queste stesse informazioni nel Mining Legend.

  6. Fare clic sul nodo per Age >=34 e < 41. L'istogramma viene visualizzato come una sottile barra orizzontale sul nodo e rappresenta la distribuzione dei clienti in questo intervallo di età che in precedenza hanno acquistato una bicicletta (rosa) e di quelli che non l'hanno acquistata (blu). Il Visualizzatore ci mostra che i clienti tra i 34 e i 40 anni con una o nessuna auto possono acquistare una bicicletta. Facendo un ulteriore passo avanti, troviamo che la probabilità di acquistare una bicicletta aumenta se il cliente ha effettivamente età da 38 a 40 anni.

Poiché è stato abilitato il drillthrough durante la creazione della struttura e del modello, è possibile recuperare informazioni dettagliate dai casi del modello e dalla struttura di mining, comprese quelle colonne che non erano incluse nel modello di mining, ad esempio emailAddress, FirstName.

Per ulteriori informazioni, vedere Drillthrough Queries (Data Mining).

Per eseguire il drill-through ai dati del caso

  1. Fare clic con il pulsante destro del mouse su un nodo e scegliere Drill-through e quindi Solo colonne modello.

    I dettagli per ogni caso di training vengono visualizzati in formato foglio di calcolo. Questi dettagli provengono dalla vista vTargetMail che hai selezionato come tabella di casi quando si costruisce la struttura di data mining.

  2. Fare clic con il pulsante destro del mouse su un nodo e selezionare Drill Through, quindi Colonne modello e struttura.

    Lo stesso foglio di calcolo viene visualizzato con le colonne della struttura accodate alla fine.

Scheda Rete di Dipendenze

Nella scheda Rete dipendenze vengono visualizzate le relazioni tra gli attributi che contribuiscono alla capacità predittiva del modello di data mining. Il visualizzatore della rete di dipendenze rafforza le nostre scoperte secondo cui l'età e la regione sono fattori importanti per prevedere l'acquisto di biciclette.

Per esplorare il modello nella scheda Rete di dipendenze
  1. Fare clic sul Bike Buyer nodo per identificare le relative dipendenze.

    Il nodo centrale per la rete di dipendenze, Bike Buyer, rappresenta l'attributo stimabile nel modello di data mining. Il grafico evidenzia tutti i nodi connessi che hanno un effetto sull'attributo stimabile.

  2. Regola il dispositivo di scorrimento Tutti i collegamenti per identificare l'attributo più influente.

    Quando si trascina il dispositivo di scorrimento, gli attributi che hanno solo un effetto debole sulla colonna [Bike Buyer] vengono rimossi dal grafico. Regolando il dispositivo di scorrimento, è possibile scoprire che Età e Regione sono i principali fattori nel predire se qualcuno è un compratore di biciclette.

Vedere questi argomenti per esplorare i dati usando gli altri tipi di modelli.

Attività successiva nella lezione

Esplorazione del modello di clustering (esercitazione di base sul data mining)

Vedere anche

Attività e procedure del Visualizzatore dei modelli di data mining
Scheda Albero delle decisioni (Visualizzatore modelli di data mining)
Scheda Rete delle Dipendenze (Visualizzatore di Modelli di Data Mining)
Esplorare un modello usando Microsoft Tree Viewer