Anzeigen eines Miningmodells mit dem Microsoft Sequenzcluster-Viewer
Der Microsoft Sequenzcluster-Viewer in Microsoft SQL Server 2005 Analysis Services (SSAS) zeigt Miningmodelle an, die mit dem Microsoft Sequence Clustering-Algorithmus erstellt wurden. Der Microsoft Sequence Clustering-Algorithmus ist ein Algorithmus für die Sequenzanalyse, der zum Durchsuchen von Daten verwendet wird, und der Ereignisse enthält, die durch folgende Pfade oder Sequenzen verknüpft werden können. Weitere Informationen zu diesem Algorithmus finden Sie unter Microsoft Sequence Clustering-Algorithmus.
Wenn Sie ein Miningmodell in Analysis Services durchsuchen, wird das Modell auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers mit dem jeweils geeigneten Viewer für das Modell angezeigt. Dieser Viewer bietet Funktionalitäten und Optionen, die denen des Microsoft Cluster-Viewers ähneln. Weitere Informationen zum Microsoft Cluster-Viewer finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Cluster-Viewer.
Viewer-Registerkarten
Der Microsoft Sequenzcluster-Viewer bietet die folgenden Registerkarten zum Durchsuchen von Sequenzcluster-Miningmodellen:
- Clusterdiagramm
- Clusterprofile
- Clustermerkmale
- Clusterunterscheidung
- Clusterübergänge
Clusterdiagramm
Die Registerkarte Clusterdiagramm des Microsoft Sequenzcluster-Viewers zeigt alle in einem Miningmodell enthaltenen Cluster an. Die Schattierung der Linie, die einen Cluster mit einem anderen verbindet, stellt den Grad der Ähnlichkeit der Cluster dar. Ist die Schattierung schwach oder ist keine Schattierung vorhanden, sind sich die Cluster kaum ähnlich. Je dunkler die Linie wird, umso mehr ähneln sich die Verknüpfungen. Sie können die Anzahl der durch den Viewer angezeigten Linien anpassen, indem Sie den Schieberegler rechts neben die Cluster schieben. Wenn Sie den Schieberegler nach unten ziehen, werden nur die stärksten Verknüpfungen angezeigt.
Standardmäßig stellt die Schattierung die Auffüllung der Cluster dar. Mithilfe der Optionen Schattierungsvariable und Status können Sie auswählen, welches Attribut- und Statuspaar die Schattierung darstellen soll. Je stärker die Schattierung ist, umso größer ist die Attributverteilung für einen spezifischen Status. Die Verteilung wird geringer, wenn die Schattierung schwächer wird.
Um einen Cluster umzubenennen, klicken Sie mit der rechten Maustaste auf den Clusterknoten, und wählen Sie Cluster umbenennen aus. Der neue Name wird auf dem Server permanent gespeichert.
Klicken Sie auf Diagrammansicht kopieren, um den sichtbaren Abschnitt des Diagramms in die Zwischenablage zu kopieren. Um das gesamte Diagramm zu kopieren, klicken Sie auf Gesamtes Diagramm kopieren. Sie können auch mit Vergrößern und Verkleinern das Diagramm vergrößern oder verkleinern oder mit Diagramm an Fenstergröße anpassen das Diagramm an den Bildschirm anpassen.
Zurück zum Anfang
Clusterprofile
Die Registerkarte Clusterprofil bietet eine Übersicht der Cluster, die der Algorithmus in Ihrem Modell erstellt. Jede Spalte, die der Spalte Auffüllung im Raster folgt, stellt einen vom Modell ermittelten Cluster dar. Die Zeile <attribute>.samples steht für verschiedene Sequenzen der im Cluster vorhandenen Daten, und die Zeile <attribute> beschreibt alle im Cluster enthaltenen Elemente und deren Gesamtverteilung.
Die Option Histogrammbalken steuert die Anzahl der im Histogramm sichtbaren Balken. Sind mehr Balken vorhanden, als Sie zum Anzeigen ausgewählt haben, werden die wichtigsten Balken beibehalten, und die restlichen Balken werden in einem grauen Bucket zusammengruppiert.
Sie können die Standardnamen der Cluster ändern, um aussagekräftige Namen bereitzustellen. Benennen Sie einen Cluster um, indem Sie mit der rechten Maustaste auf die Spaltenüberschrift des Clusters klicken und Cluster umbenennen auswählen. Sie können Cluster ausblenden, indem Sie Spalte ausblenden auswählen. Sie können auch Spalten an andere Positionen ziehen, um diese im Viewer neu zu ordnen.
Doppelklicken Sie entweder auf eine Zelle in der Spalte Status oder auf ein Histogramm im Viewer, um ein Fenster zu öffnen, das eine größere, detailliertere Ansicht der Cluster bietet.
Zurück zum Anfang
Clustermerkmale
Um die Registerkarte Clustermerkmale zu verwenden, wählen Sie in der Liste Cluster einen Cluster aus. Nachdem Sie einen Cluster ausgewählt haben, können Sie die Merkmale dieses bestimmten Clusters überprüfen. Die im Cluster enthaltenen Attribute werden in den Spalten Variablen und der Status der aufgelisteten Attribute in der Spalte Werte aufgelistet. Attributstatus werden nach der Reihenfolge der Wichtigkeit aufgelistet und durch die Wahrscheinlichkeit, dass sie im Cluster angezeigt werden, beschrieben. Die Wahrscheinlichkeit wird in der Spalte Wahrscheinlichkeit angezeigt.
Zurück zum Anfang
Clusterunterscheidung
Sie können die Registerkarte Clusterunterscheidung verwenden, um die Attribute zwischen zwei Clustern zu vergleichen, um festzustellen, wie die Elemente einer Sequenz bestimmte Cluster vor anderen bevorzugen. Verwenden Sie die Listen Cluster 1 und Cluster 2, um die zu vergleichenden Cluster auszuwählen. Der Viewer bestimmt die wichtigsten Unterschiede zwischen den Clustern und zeigt die den Unterschieden zugeordneten Attributstatus nach der Reihenfolge der Wichtigkeit an. Ein Balken rechts neben dem Attribut zeigt an, welchen Cluster der Status bevorzugt; die Größe des Balkens zeigt dabei an, wie stark der Status den Cluster bevorzugt.
Zurück zum Anfang
Clusterübergänge
Sie können die Übergänge zwischen Sequenzstatus in einem ausgewählten Cluster durchsuchen, indem Sie auf der Registerkarte Clusterübergänge einen Cluster auswählen. Jeder Knoten im Viewer stellt einen Status der Sequenzspalte dar. Ein Pfeil stellt einen Übergang zwischen zwei Status dar, und die Wahrscheinlichkeit, dass dieser einem Übergang zugeordnet ist. Ein Pfeil kann zum Ausgangsknoten zurückverweisen, wenn ein Übergang zum Ausgangsknoten zurückkehrt.
Ein aus einem Punkt stammender Pfeil stellt die Wahrscheinlichkeit dar, dass der Knoten der Anfang einer Sequenz ist. Eine abschließende Kante, die zu einer Null führt, stellt die Wahrscheinlichkeit dar, dass der Knoten das Ende der Sequenz ist.
Sie können die Knotenkante mithilfe des Schiebereglers, der sich links von der Registerkarte befindet, filtern.
Zurück zum Anfang
Siehe auch
Konzepte
Microsoft Sequence Clustering-Algorithmus
Verwenden der Data Mining-Tools
Anzeigen eines Miningmodells mit dem Microsoft Cluster-Viewer
Andere Ressourcen
Vorgehensweisen zur Miningmodell-Viewer-Registerkarte
Vorgehensweisen zur Miningmodell-Viewer-Registerkarte
Anzeigen eines Data Mining-Modells