Condividi tramite


Esplorazione dei modelli Market Basket (Esercitazione intermedia sul data mining)

Dopo aver creato il modello Association, è possibile esaminarlo utilizzando il Visualizzatore Microsoft Association Rules disponibile nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. In questa esercitazione viene descritto l'utilizzo del visualizzatore per esplorare le relazioni tra elementi. Il visualizzatore consente di visualizzare immediatamente i prodotti che tendono a comparire insieme e di ottenere un'idea generale degli schemi risultanti.

Il Visualizzatore Microsoft Association Rules contiene tre schede, ovvero Regole, Set di elementi e Rete di dipendenze. Poiché ogni scheda rivela una vista leggermente diversa dei dati, quando si esplora un modello, in genere si passa diverse volte da un riquadro all'altro man mano che si ottengono le informazioni.

  • Scheda Rete di dipendenze

  • Scheda Set di elementi

  • Scheda Regole

  • Generic Content Tree Viewer

Per questa esercitazione si inizierà dalla scheda Rete di dipendenze, quindi si utilizzeranno la scheda Regole e la scheda Set di elementi per approfondire la comprensione delle relazioni rivelate nel visualizzatore. Verrà anche utilizzato Microsoft Generic Content Tree Viewer per recuperare statistiche dettagliate relative a regole o set di elementi individuali.

Scheda Rete di dipendenze

La scheda Rete di dipendenze consente di esaminare l'interazione tra i diversi elementi presenti nel modello. Ogni nodo nel visualizzatore rappresenta un elemento, mentre le linee tra i nodi rappresentano regole. Selezionando un nodo, è possibile visualizzare gli altri nodi che stimano l'elemento selezionato oppure gli elementi stimati dall'elemento corrente. In alcuni casi, è presente un'associazione bidirezionale tra gli elementi, ovvero che compaiono spesso nella stessa transazione. È possibile fare riferimento alla legenda dei colori nella parte inferiore della scheda per determinare la direzione dell'associazione.

Una linea che collega due elementi indica che è probabile che questi elementi compaiano insieme in una transazione. In altre parole, è probabile che i clienti acquistino insieme questi elementi. Il dispositivo di scorrimento è associato alla probabilità della regola. Spostare il dispositivo di scorrimento verso l'alto o verso il basso per escludere le associazioni deboli, ovvero le regole con una bassa probabilità.

Il grafico della rete di dipendenza mostra coppie di regole che possono essere rappresentate logicamente come A->B, nel senso che se viene acquistato il prodotto A, il prodotto B è probabile. Il grafico non può mostrare regole del tipo AB->C. Se si sposta il dispositivo di scorrimento per mostrare tutte le regole ma non è comunque visibile alcuna linea nel grafico, ciò significa che non vi sono coppie di regole che soddisfano i criteri dei parametri dell'algoritmo.

È anche possibile trovare i nodi in base al nome, digitando le prime lettere del nome di attributo. Per ulteriori informazioni, vedere Finestra di dialogo Trova nodo (visualizzazione Visualizzatore modello di data mining).

Per aprire il modello Association nel Visualizzatore Microsoft Association Rules

  1. In Esplora soluzioni fare doppio clic sulla struttura Association.

  2. In Progettazione modelli di data mining fare clic sulla scheda Visualizzatore modello di data mining.

  3. Selezionare Association dall'elenco dei modelli di data mining nell'elenco a discesa Modello di data mining.

Per spostarsi nel grafico delle dipendenze e individuare nodi specifici

  1. Nella scheda Visualizzatore modello di data mining fare clic sulla scheda Rete di dipendenze.

  2. Fare clic diverse volte su Zoom avanti, fino a quando non è possibile visualizzare facilmente le etichette relative a ogni nodo.

    Per impostazione predefinita, il grafico viene visualizzato con tutti i nodi visibili. In un modello complesso possono esservi molti nodi, ognuno dei quali risulta piuttosto piccolo.

  3. Fare clic sul segno + nell'angolo inferiore destro del visualizzatore e tenere premuto il pulsante del mouse per eseguire una panoramica del grafico.

  4. Sul lato sinistro del visualizzatore trascinare il dispositivo di scorrimento verso il basso, spostandolo da Tutti i collegamenti (impostazione predefinita) fino alla parte inferiore del dispositivo di scorrimento.

  5. Il visualizzatore aggiornerà il grafico in modo da mostrare solo l'associazione più forte, tra gli elementi Touring Tire e Touring Tire Tube.

  6. Fare clic sul nodo denominato Touring Tire Tube = Esistente.

    Il grafico viene aggiornato in modo da evidenziare solo gli elementi che sono fortemente correlati a questo elemento. Si noti la direzione della freccia tra i due elementi.

  7. Sul lato sinistro del visualizzatore trascinare nuovamente il dispositivo di scorrimento verso l'alto, spostandolo dalla parte inferiore fino alla parte centrale.

    Si notino le modifiche nella freccia che connette i due elementi.

  8. Selezionare Mostra solo il nome dell'attributo dall'elenco a discesa nella parte superiore del riquadro Rete di dipendenze.

    Le etichette di testo nel grafico verranno aggiornate per mostrare solo il nome del modello.

Torna all'inizio

Scheda Set di elementi

Il passaggio successivo consiste nell'ottenere maggiori informazioni sulle regole e sui set di elementi generati dal modello per i prodotti Touring Tire e Touring Tire Tube. Nella scheda Set di elementi vengono visualizzati tre importanti tipi di informazioni che fanno riferimento ai set di elementi individuati dall'algoritmo Microsoft Association.

  • **Supporto:    **numero di transazioni nel quale si verifica il set di elementi.

  • **Dimensioni:    **numero di elementi inclusi nel set di elementi.

  • **Elementi:    **elenco degli elementi inclusi in ciascun set di elementi.

L'algoritmo consente di generare molti set di elementi a seconda della modalità di impostazione dei parametri. Ciascun set di elementi visualizzato rappresenta transazioni relative alla vendita dell'elemento. I controlli disponibili nella parte superiore della scheda Set di elementi consentono di filtrare il visualizzatore in modo da mostrare solo i set di elementi contenenti dimensioni e supporto minimi specificati.

Se si utilizza un diverso modello di data mining e non vengono elencati set di elementi, questo avviene perché nessun set di elementi soddisfa il criterio dei parametri dell'algoritmo. In tale scenario, è possibile modificare i parametri dell'algoritmo per consentire set di elementi che dispongono di un supporto inferiore.

Per filtrare i set di elementi mostrati nel visualizzatore per nome

  1. Fare clic sulla scheda Set di elementi del visualizzatore.

  2. Nella casella Filtra set di elementi digitare Touring Tire, quindi fare clic fuori dalla casella.

    Il filtro restituirà tutti gli elementi che contengono questa stringa.

  3. Nell'elenco Mostra selezionare Mostra solo il nome dell'attributo.

  4. Selezionare la casella di controllo Mostra nomi lunghi.

    L'elenco dei set di elementi verrà aggiornato per mostrare solo i set di elementi che contengono la stringa Touring Tire. Il nome lungo del set di elementi include il nome della tabella che contiene l'attributo e il valore per ogni elemento.

  5. Deselezionare la casella di controllo Mostra nomi lunghi.

    L'elenco dei set di elementi verrà aggiornato per mostrare solo il nome breve.

I valori nella colonna Supporto indicano il numero di transazioni per ogni set di elementi. Una transazione per un set di elementi indica un acquisto in cui erano inclusi tutti gli elementi nel set di elementi.

Per impostazione predefinita, il visualizzatore elenca i set di elementi per supporto in ordine decrescente. È possibile fare clic sulle intestazioni di colonna per eseguire l'ordinamento in base a una colonna diversa, ad esempio il nome o la dimensione del set di elementi. Se si è interessati a ottenere maggiori informazioni sulle singole transazioni incluse in un set di elementi, è possibile eseguire il drill-through dai set di elementi ai singoli case. Le colonne della struttura nei risultati del drill-through sono il livello di reddito del cliente e l'ID cliente, che non sono stati utilizzati nel modello.

Per visualizzare i dettagli per un set di elementi

  1. Nell'elenco dei set di elementi fare clic sull'intestazione di colonna Set di elementi per eseguire l'ordinamento in base al nome.

  2. Individuare l'elemento Touring Tire (senza il secondo elemento).

  3. Fare clic con il pulsante destro del mouse sull'elemento Touring Tire, scegliere Drill-through, quindi Colonne struttura e modello.

    Nella finestra di dialogo Drill-through verranno visualizzate le singole transazioni utilizzate come supporto per il set di elementi.

  4. Espandere la tabella nidificata vAssocSeqLineItems per visualizzare l'elenco effettivo di acquisti nella transazione.

Per filtrare i set di elementi per supporto o per dimensione

  1. Cancellare qualsiasi testo presente nella casella Filtra set di elementi. Non è possibile utilizzare un filtro basato su testo insieme con un filtro numerico.

  2. Nella casella Supporto minimo digitare 100, quindi fare clic sullo sfondo del visualizzatore.

    L'elenco dei set di elementi verrà aggiornato in modo da mostrare solo i set di elementi con supporto di almeno 100.

Torna all'inizio

Scheda Regole

Nella scheda Regole vengono visualizzate le informazioni seguenti relative alle regole individuate dall'algoritmo.

  • Probabilità: la probabilità di una regola, definita come la probabilità dell'elemento di destra dato l'elemento di sinistra.

  • Importanza: una misura dell'utilità di una regola. Un valore superiore indica una regola migliore.

    L'importanza viene fornita per aiutare a misurare l'utilità di una regola, perché la probabilità da sola può essere fuorviante. Ad esempio, se ogni transazione contenesse una bottiglia d'acqua (si supponga che la bottiglia d'acqua venga aggiunta automaticamente agli acquisti di ogni cliente nell'ambito di una promozione), il modello creerebbe una regola che stima che la bottiglia di acqua dispone di una probabilità pari a 1. Sulla base della sola probabilità, questa regola è molto accurata, ma non fornisce informazioni utili.

  • **Regola:    **la definizione della regola. Per un modello Market Basket, una regola descrive una specifica combinazione di elementi.

Ogni regola può essere utilizzata per fare previsioni sulla presenza di un elemento in una transazione in base alla presenza di altri elementi. Analogamente alla scheda Set di elementi, è possibile filtrare le regole in modo da mostrare solo le più interessanti. Se si utilizza un modello di data mining che non dispone di regole, potrebbe essere necessario modificare i parametri dell'algoritmo per abbassare la soglia di probabilità per le regole.

Per visualizzare solo le regole che includono la bicicletta Mountain-200

  1. Nella scheda Visualizzatore modello di data mining fare clic sulla scheda Regole.

  2. Nella casella Filtro regola immettere Mountain-200.

    Deselezionare la casella di controllo Mostra nomi lunghi.

  3. Nell'elenco Mostra selezionare Mostra solo il nome dell'attributo.

    Verranno visualizzate solo le regole che contengono il testo "Mountain-200". La probabilità della regola indica quanto è probabile che una persona che acquista una bicicletta Mountain-200 acquisti anche l'altro prodotto elencato.

Le regole vengono ordinate per probabilità in ordine decrescente, ma è possibile fare clic sulle intestazioni di colonna per modificare l'ordinamento. Se si è interessati a ottenere maggiori dettagli su una particolare regola, è possibile utilizzare il drill-through per visualizzare i case di supporto.

Per visualizzare i case che supportano una particolare regola

  1. Nella scheda Regole fare clic con il pulsante destro del mouse sulla regola che si desidera visualizzare.

  2. Scegliere Drill-through, quindi Solo colonne modello o Colonne struttura e modello.

    La finestra di dialogo Drill-through fornisce un riepilogo della regola nella parte superiore del riquadro e un elenco di tutti i case utilizzati come dati di supporto per la regola.

Torna all'inizio

Generic Content Tree Viewer

Questo visualizzatore può essere utilizzato per tutti i modelli, indipendentemente dall'algoritmo o dal tipo di modello. Microsoft Generic Content Tree Viewer è disponibile nell'elenco a discesa Visualizzatore.

Una struttura del contenuto è una rappresentazione di un modello di data mining sotto forma di una serie di nodi, dove ogni nodo rappresenta le informazioni relative a un subset di dati. Il nodo può contenere un modello, un set di regole, un cluster o la definizione di un intervallo di date che condividono le stesse caratteristiche. Il contenuto esatto del nodo differisce a seconda dell'algoritmo e del tipo di attributo stimabile, ma la rappresentazione generale del contenuto è la stessa. È possibile espandere ogni nodo per aumentare il livello di dettaglio e copiare il contenuto di qualsiasi nodo negli Appunti.

Per visualizzare i dettagli sulla regola tramite Generic Content Tree Viewer

  1. Nella scheda Visualizzatore modello di data mining selezionare Microsoft Generic Content Tree Viewer dall'elenco Visualizzatore.

  2. Nel riquadro Didascalia nodo scorrere fino alla fine dell'elenco, quindi fare clic sull'ultimo nodo.

    Il visualizzatore mostra prima i set di elementi e quindi le regole, ma non li raggruppa. Il modo più semplice per individuare un nodo specifico è creare una query contenuto. Per ulteriori informazioni, vedere Esecuzione di query su un modello di associazione (Analysis Services - Data mining).

  3. Nel riquadro Dettagli nodo esaminare il valore di NODE_TYPE e NODE_DESCRIPTION.

    Un tipo di nodo 8 è una regola e un tipo di nodo 7 è un set di elementi. Per una regola, il valore di NODE_DESCRIPTION indica le condizioni che costituiscono la regola. Per un set di elementi, il valore di NODE_DESCRIPTION indica gli elementi inclusi nel set di elementi.

È anche possibile creare una query contenuto per ottenere statistiche dettagliate sulle regole. Per ulteriori informazioni sul contenuto dei modelli di data mining e sulla loro interpretazione, vedere Contenuto dei modelli di data mining per i modelli di associazione (Analysis Services - Data mining).

Torna all'inizio