Visualizzazione di un modello di data mining con il Visualizzatore Microsoft Sequence Clustering
Il Visualizzatore Microsoft Sequence Clustering disponibile in Microsoft SQL Server 2005 Analysis Services (SSAS) consente di visualizzare i modelli di data mining generati con l'algoritmo Microsoft Sequence Clustering. L'algoritmo Microsoft Sequence Clustering è un algoritmo di analisi delle sequenze da utilizzare per l'esplorazione di dati contenenti eventi che possono essere collegati dai percorsi o sequenze seguenti. Per ulteriori informazioni su questo algoritmo, vedere Algoritmo Microsoft Sequence Clustering.
Per la visualizzazione di un modello di data mining in Analysis Services viene utilizzato il visualizzatore appropriato nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. Questo visualizzatore offre funzionalità e opzioni analoghe a quelle del Visualizzatore Microsoft Clustering. Per ulteriori informazioni sul Visualizzatore Microsoft Clustering, vedere Visualizzazione di un modello di data mining con il Visualizzatore Microsoft Clustering.
Schede del visualizzatore
Per l'esplorazione di modelli di data mining per il clustering delle sequenze, nel Visualizzatore Microsoft Sequence Clustering sono disponibili le schede seguenti:
- Diagramma dei cluster
- Profili cluster
- Caratteristiche cluster
- Analisi discriminante tra cluster
- Transizioni di stato
Diagramma dei cluster
Nella scheda Diagramma dei cluster del Visualizzatore Microsoft Sequence Clustering vengono visualizzati tutti i cluster di un modello di data mining. L'ombreggiatura della linea che collega un cluster all'altro rappresenta il grado di somiglianza dei cluster. Se l'ombreggiatura è chiara o inesistente, il grado di somiglianza dei cluster è basso. Man mano che la linea diventa più scura, il grado di somiglianza dei collegamenti aumenta. È possibile modificare il numero di linee visualizzate regolando il dispositivo di scorrimento a destra dei cluster. Se si sposta il dispositivo di scorrimento verso il basso, vengono visualizzati solo i collegamenti più attendibili.
Per impostazione predefinita, l'ombreggiatura rappresenta la popolazione del cluster. Tramite le opzioni Variabileombreggiatura e Stato, è possibile selezionare la coppia attributo/stato rappresentata dall'ombreggiatura. Più scura è l'ombreggiatura, maggiore è la distribuzione dell'attributo per uno stato specifico. La distribuzione diminuisce man mano che l'ombreggiatura diventa più chiara.
Per rinominare un cluster, fare clic con il pulsante destro del mouse sul nodo corrispondente e selezionare Rinomina cluster. Il nuovo nome è persistente nel server.
Per copiare la sezione visibile del diagramma negli Appunti, fare clic su Copia parte visibile del grafico. Per copiare il diagramma completo, fare clic su Copia grafico intero. È inoltre possibile ingrandire o ridurre il diagramma mediante Zoom avanti e Zoom indietro oppure adattarlo alla schermata mediante Ridimensiona e adatta il diagramma alla finestra.
Torna all'inizio
Profili cluster
La scheda Profili cluster offre una vista globale dei cluster creati dall'algoritmo nel modello. Ogni colonna che segue la colonna Popolazione della griglia rappresenta un cluster individuato dal modello. La riga <attributo>.samples rappresenta sequenze diverse di dati che esistono nel cluster, mentre la riga <attributo> descrive tutti gli elementi contenuti nel cluster e la distribuzione complessiva corrispondente.
L'opzione Barre istogramma consente di controllare il numero di barre visibili nell'istogramma. Se esiste un numero di barre superiore a quello che si sceglie di visualizzare, le barre più importanti vengono mantenute mentre le barre rimanenti vengono raggruppate in un bucket grigio.
È possibile modificare i nomi predefiniti dei cluster in modo da renderli più descrittivi. Per rinominare un cluster, fare clic con il pulsante destro del mouse sull'intestazione di colonna corrispondente e scegliere Rinomina cluster. È possibile nascondere i cluster selezionando Nascondi colonna, nonché trascinare le colonne per riordinarle nel visualizzatore.
Per aprire una finestra contenente una vista più grande e dettagliata dei cluster, fare doppio clic su una cella nella colonna Stati o su un istogramma nel visualizzatore.
Torna all'inizio
Caratteristiche cluster
Per utilizzare la scheda Caratteristiche cluster, selezionare un cluster dall'elenco Cluster. Dopo aver selezionato un cluster, è possibile esaminare le caratteristiche del cluster specifico. Gli attributi contenuti nel cluster sono elencati nelle colonne Variabili, mentre lo stato di ogni attributo è elencato nella colonna Valori. Gli stati degli attributi sono elencati in ordine di importanza, desumibile in base alla probabilità che vengano inclusi nel cluster. La probabilità è indicata nella colonna Probabilità.
Torna all'inizio
Analisi discriminante tra cluster
La scheda Analisi discriminante tra cluster consente di confrontare gli attributi di due cluster, al fine di determinare in che misura gli elementi di una sequenza prediligono un cluster rispetto a un altro. Per selezionare i cluster da confrontare, utilizzare gli elenchi Cluster 1 e Cluster 2. Il visualizzatore determina le differenze più importanti tra i cluster e mostra gli stati degli attributi associati alle differenze, in ordine di importanza. Una barra a destra dell'attributo indica il cluster che lo stato predilige e le dimensioni della barra indicano, in proporzione, quanto lo predilige.
Torna all'inizio
Transizioni di stato
Se si seleziona un cluster nella scheda Transizioni di stato, è possibile visualizzare le transizioni tra stati di sequenza nel cluster selezionato. Ogni nodo all'interno del visualizzatore rappresenta uno stato della colonna relativa alla sequenza. Una freccia rappresenta una transizione tra due stati e la probabilità associata alla transizione. Se una transizione torna al nodo di origine, la freccia può puntare di nuovo a tale nodo.
Una freccia che ha origine da un punto rappresenta la probabilità che il nodo sia l'inizio di una sequenza. Un bordo finale che conduce a un valore Null rappresenta la probabilità che il nodo sia la fine della sequenza.
È possibile filtrare il bordo dei nodi mediante il dispositivo di scorrimento a sinistra della scheda.
Torna all'inizio
Vedere anche
Concetti
Algoritmo Microsoft Sequence Clustering
Utilizzo degli strumenti di data mining
Visualizzazione di un modello di data mining con il Visualizzatore Microsoft Clustering
Altre risorse
Procedure per la scheda Visualizzatore modello di data mining
Procedure per la scheda Visualizzatore modello di data mining
Visualizzazione di un modello di data mining