Prüfen der Sequence Clustering-Modelle (Data Mining-Lernprogramm)
Sie haben das Modell Sequence Clustering erstellt und können es jetzt überprüfen. Dazu verwenden Sie den Microsoft Sequenzcluster-Viewer auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers. Der Microsoft Sequenzcluster-Viewer umfasst fünf Registerkarten: Clusterdiagramm, Clusterprofile, Clustermerkmale, Clusterunterscheidung und Statusübergänge. Weitere Informationen zum Verwenden des Viewers finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Sequenzcluster-Viewer.
Registerkarte Clusterdiagramm
Auf der Registerkarte Clusterdiagramm werden die Cluster grafisch dargestellt, die der Algorithmus in der Datenbank festgestellt hat. Das Layout im Diagramm gibt die Beziehungen der Cluster an, wobei ähnliche Cluster nahe zusammen gruppiert sind. Standardmäßig gibt die Schattierung der Knotenfarbe die Dichte aller Fälle auf dem Cluster an, d. h. je dunkler der Knoten ist, desto mehr Fälle umfasst er. Sie können die Bedeutung der Knotenschattierung ändern, sodass diese ein Attribut und einen Status angibt. Beispiel: Wählen Sie in der Liste Schattierungsvariable den Eintrag Model aus, und wählen Sie dann in der Liste Status den Eintrag Cycling Cap aus. Das Clusterdiagramm zeigt an, dass der Cluster 9 die höchste Dichte für das Produkt Cycling Caps aufweist.
Registerkarte Clusterprofile
Auf der Registerkarte Clusterprofile werden die Sequenzen angezeigt, die auf jedem Cluster vorhanden sind. Die Cluster werden in einzelnen Spalten rechts von der Spalte Status aufgelistet.
Im Viewer steht die Zeile Model.samples für Sequenzdaten, und die Zeile Modell beschreibt die gesamte Verteilung von Elementen in einem Cluster. Jede Linie der Farbsequenzen in den einzelnen Zellen der Zeile Model.samples steht für das Verhalten eines zufällig ausgewählten Benutzers im Cluster. Jede Farbe in einem Sequenzhistogramm steht für ein Produktmodell.
So steht die Farbe aqua im Cluster 3 für das Fahrrad vom Typ Mountain-200. Die Tatsache, dass sie in den meisten Sequenzen als erste Farbe steht, gibt an, dass die Wahrscheinlichkeit recht hoch ist, dass ein Kunde das Fahrrad vom Typ Mountain-200 zuerst in den Einkaufskorb legt.
Registerkarte Clustermerkmale
Auf der Registerkarte Clustermerkmale werden die Übergänge zwischen den Status eines Clusters zusammengefasst. Dabei beschreiben Balken die Bedeutung eines Attributwertes für den ausgewählten Cluster. Beispiel: Im Cluster 10 ist eines der wichtigsten Profile, dass Kunden tendenziell den Reifen vom Typ ML Mountain zuerst in den Einkaufskorb legen.
Registerkarte Clusterunterscheidung
Mithilfe der Registerkarte Clusterunterscheidung können Sie zwei Cluster unterscheiden, um festzustellen, welche Modelle welche Cluster begünstigen. Die Registerkarte umfasst vier Spalten: Variablen, Werte, Cluster 1 und Cluster 2. Wenn der Cluster ein bestimmtes Modell begünstigt, wird ein blauer Balken in der Spalte Cluster 1 oder Cluster 2 in der Zeile des entsprechenden Modells in der Spalte Variablen angezeigt. Je länger der blaue Balken ist, desto mehr begünstigt das Modell den Cluster.
Beispiel: Verwenden Sie die Registerkarte Clusterunterscheidung im Viewer, um Cluster 2 mit Cluster 5 zu vergleichen. Wählen Sie dazu Cluster 2 in Cluster 1 und Cluster 5 in Cluster 2. Ein Kunde, der einen Flaschenhalter für ein Mountainbike kauft, wie durch Mountain Bottle Cage in der Spalte Werte angegeben, ist mit größerer Wahrscheinlichkeit in Cluster 5, und ein Kunde, der einen Touringreifen kauft, wie in Touring Tire in der Spalte Werte angegeben, wird mit höherer Wahrscheinlichkeit in Cluster 2 gruppiert.
Registerkarte Statusübergänge
Auf der Registerkarte Statusübergänge können Sie einen Cluster auswählen und die Statusübergänge durchsuchen. Jeder Knoten steht für einen Status des Modells, wie z. B. Mountain-200. Eine Linie steht für einen Statusübergang, und jeder Knoten basiert auf der Wahrscheinlichkeit eines Übergangs. Die Hintergrundfarbe gibt die Frequenz des Knotens im Cluster an.
Beispiel: Wählen Sie Cluster 3 aus Cluster aus, wählen Sie den Knoten Touring-3000 aus, und schieben Sie den Regler Alle Verknüpfungen nach unten. Dem Viewer können Sie Folgendes entnehmen: Wenn ein Kunde einen Reifen vom Typ Touring Tire in den Einkaufskorb legt, dann beträgt die Wahrscheinlichkeit 0,63 (wird durch den blauen Pfeil angegeben), dass der Kunde als Nächstes einen Schlauch für diesen Reifen in den Einkaufskorb legt. Die Wahrscheinlichkeit, dass der Kunde auch ein Fahrrad vom Typ Sport 100 in den Einkaufskorb legt, beträgt 0,26.