Prüfen des Planungserstellungsmodells (Data Mining-Lernprogramm für Fortgeschrittene)
Nachdem Sie das Miningmodell für die Planung erstellt haben, können Sie die Ergebnisse überprüfen. Verwenden Sie hierzu die Registerkarte Miningmodell-Viewer im Data Mining-Designer. Der Microsoft Time Series-Viewer enthält zwei Registerkarten: Diagramme und Modell.
Das von Ihnen erstellte Miningmodell für die Planung beschreibt den Produktverkauf in drei Regionen (Europa, Nordamerika und Pazifik) für die Jahre 2005 bis 2010. Der Microsoft Time Series-Algorithmus erzeugt daher ein Zeitreihenmodell mit mehreren Strukturen, von denen jede eine andere Kombination aus Region, Produkt und vorhersagbarem Attribut enthält.
Jede Registerkarte im Viewer zeigt eine andere Ansicht der Informationen im vollständigen Zeitreihenmodell.
Registerkarte Diagramme
Registerkarte Modell
Generic Content Tree Viewer
Registerkarte Diagramme
Auf der Registerkarte Diagramme des Microsoft Time Series-Viewers werden alle durch den Algorithmus erstellten Strukturen grafisch dargestellt. Eine Zeitreihenstruktur enthält eine spezifische Kombination aus Produkt, Region und vorhersagbarem Attribut.
In der Legende auf der rechten Seite des Viewers werden die Zeitreihen aufgeführt, die in der Dropdownliste ausgewählt sind. Für jede Zeitreihe ist ein Kontrollkästchen vorhanden. Aktivieren und deaktivieren Sie die Kontrollkästchen in der Legende, um zu steuern, welche Zeitreihe im Viewer angezeigt wird.
Sie können hier zudem die Anzeigeoptionen ändern, z. B. die für eine bestimmte Zeitreihe verwendete Farbe oder ob Werte an Punkten im Diagramm angezeigt werden.
So wählen Sie eine Zeitreihe aus
Klicken Sie auf die Registerkarte Diagramme im Miningmodell-Viewer, wenn diese nicht bereits angezeigt wird.
Klicken Sie auf die Dropdownliste rechts neben der Diagrammansicht, und aktivieren Sie alle Kontrollkästchen. Das Diagramm sollte 24 Zeilen für die verschiedenen Reihen enthalten.
Klicken Sie auf OK.
Deaktivieren Sie die Kontrollkästchen rechts vom Diagramm, um die Zeilen für alle auf dem Betrag basierenden Reihen vorübergehend auszublenden.
Deaktivieren Sie nun die Kontrollkästchen für die Fahrräder R750 und R250.
Das Diagramm enthält anschließend nur die folgenden sechs Reihenzeilen, sodass Sie die Trends für die Fahrräder M200 und T1000 besser vergleichen können.
M200 Europe: Quantity
M200 North America: Quantity
M200 Pacific: Quantity
T1000 Europe: Quantity t
T1000 North America: Quantity
T1000 Pacific: Quantity
Im Diagramm werden sowohl Vergangenheitsdaten als auch vorhergesagte Daten angezeigt. Die vorhergesagten Daten sind schattiert dargestellt, um sie von den Vergangenheitsdaten abzugrenzen. Um den Vergleich unterschiedlicher Reihen zu erleichtern, können Sie außerdem die jeder Zeile im Diagramm zugeordneten Farben ändern. Weitere Informationen finden Sie unter Vorgehensweise: Ändern der Farben im Data Mining-Viewer.
Die Trendlinien zeigen, dass der Gesamtumsatz für alle Regionen zunimmt, wobei alle 12 Monate im Dezember Spitzenwerte verzeichnet werden. Die Vorhersagen folgen im Allgemeinen diesem Trend. Das Diagramm zeigt darüber hinaus, dass die Daten für das Fahrrad T1000 deutlich später beginnen als die Daten für die anderen Produktreihen.
Standardmäßig zeigt Analysis Services für jede Zeitreihe fünf Vorhersageschritte. Sie können diesen Wert jedoch ändern und mehr oder weniger Vorhersageschritte anzeigen. Sie können die Standardabweichung für die Vorhersage zudem grafisch darstellen, indem Sie dem Diagramm Fehlerindikatoren hinzufügen.
So ändern Sie die Vorhersage- und Anzeigeoptionen in der Diagrammansicht
Ändern Sie den Wert für Vorhersageschritte nach und nach von 5 auf 10 und zurück auf 6.
Hinweis Bei Trendlinien mit großen Abweichungen der Vergangenheitsdaten verstärken sich diese Abweichungen in der Vorhersage.
Aktivieren Sie das Kontrollkästchen Abweichungen anzeigen.
Platzieren Sie die Maus über den Fehlerindikatoren für die Reihe M200.
Platzieren Sie die Maus über den Fehlerindikatoren für die Reihe T1000 Pacific.
Sie verwenden diese Ergebnisse, um weitere Daten zu ermitteln. Im weiteren Verlauf entwickeln Sie ein Modell, das einen Durchschnitt aller Regionen bildet und daher nur geringen Schwankung unterliegt.
Zurück zum Anfang
Registerkarte Modell
Auf der Registerkarte Modell im Microsoft Time Series-Viewer des Data Mining-Designers können Sie die Zeitreihe als Entscheidungsstrukturdiagramm anzeigen. Es wird eine separate Struktur für jede Reihe berechnet, die Sie in das Modell eingeschlossen haben. In einem Zeitreihenmodell kann das Entscheidungsstrukturdiagramm einen einzelnen Knoten (bei linearen Zeitreihen) oder mehrere Knoten und Bedingungen für jede Verzweigung ähnlich wie eine herkömmliche Entscheidungsstruktur aufweisen.
Die Knoten im Entscheidungsstrukturdiagramm für eine Zeitreihe enthalten u. a. die folgenden Informationen:
Die Bündelung der Fälle für den Status des vorhersagbaren Attributs, das im Steuerelement Hintergrund angegeben ist. Die genaue Anzahl von Fällen wird sowohl im Fenster Knotenlegende+++ als auch im QuickInfo-Text angegeben, der eingeblendet wird, wenn Sie die Maus auf einem Objekt in der Struktur platzieren.
Die Regressionsformel für den Knoten. Die ARTXP-Regressionsformel ist nur in den Endknoten verfügbar. Die ARIMA-Formel ist im Stammknoten der Struktur verfügbar.
Ein Rautendiagramm, das den Bereich des Attributs darstellt. Die Raute befindet sich am Mittelwert des Knotens. Die Breite der Raute gibt die Varianz des Attributs an diesem Knoten an.
So zeigen Sie die Entscheidungsstruktur für ein Zeitreihenmodell an
Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe M200 North America: Amount aus.
Im Diagramm wird ein einzelner Knoten angezeigt.
Platzieren Sie den Mauszeiger über dem Knoten.
Bei einem Knoten Alle enthält der angezeigte QuickInfo-Text Informationen wie die Anzahl der Fälle in der gesamten Reihe und Zeitreihenformeln, die anhand der Datenanalyse abgeleitet wurden.
Klicken Sie auf den Knoten und zeigen Sie die Mininglegende an.
Die Mininglegende beinhaltet ähnliche Informationen wie der QuickInfo-Text, sie stellt jedoch weitere Details bereit, einschließlich eines Histogramms der Werte.
Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe M200 Pacific: Amount aus.
Das Strukturdiagramm enthält jetzt einen Knoten Alle und zwei untergeordnete Knoten. Der Text in den untergeordneten Knoten gibt die Bedingungen für die Teilung der Struktur an.
Platzieren Sie den Mauszeiger über einem der untergeordneten Knoten, und überprüfen Sie den Inhalt der QuickInfo. Sie können auch auf den Knoten klicken und die Mininglegende anzeigen.
Bei untergeordneten Knoten enthält die Beschreibung die Anzahl der Fälle in jeder Verzweigung der Struktur und alle zusätzlichen Bedingungen, die zur Teilung der Struktur geführt haben.
Zurück zum Anfang
Generic Content Tree Viewer
Zusätzlich zum benutzerdefinierten Viewer für Zeitreihen stellt Analysis Services den MicrosoftGeneric Content Tree Viewer bereit. Dieser Viewer kann für alle Data Mining-Modelle verwendet werden, unabhängig vom verwendeten Algorithmus. Der Generic Content Tree Viewer ist in der Dropdownliste Viewer verfügbar.
In diesem Viewer wird jedes Miningmodell unabhängig von den Daten oder Algorithmen, die für die Analyse verwendet wurden, als eine Struktur mit einer Reihe von Knoten dargestellt. Jeder Knoten enthält Informationen zu einer Teilmenge der Daten. Der genaue Inhalt des Knotens ist je nach Algorithmus und Typ des vorhersagbaren Attributs unterschiedlich, das allgemeine Schema des Inhalts ist jedoch gleich.
Da das von Ihnen erstellte Data Mining-Modell ein gemischtes Modell ist und ARTXP- sowie ARIMA-Algorithmen kombiniert, verwendet Analysis Services beide Algorithmen, um separate ARTXP- und ARIMA-Modelle für jede Zeitreihe zu erstellen. Wenn Sie den Microsoft Time Series-Viewer zum Durchsuchen des Miningmodells für die Planung verwenden, kombiniert Analysis Services die Ergebnisse der beiden Algorithmen und zeigt das Miningmodell als einzelne Struktur an, wobei jeder Knoten in der Struktur Teile des Inhalts beider Algorithmen enthält.
Bei Verwendung des MicrosoftGeneric Content Tree Viewer wird der von den beiden Algorithmen generierte Inhalt allerdings in jeweils unterschiedlichen Knotentypen innerhalb des Miningmodells für die Planung angezeigt. Führen Sie entweder in der ARTXP- oder der ARIMA-Version des Modells einen Drilldown aus, um zunehmende Detailebenen anzuzeigen.
So zeigen Sie Details für eine bestimmte Datenreihe im Generic Content Tree Viewer an
Wählen Sie auf der Registerkarte Miningmodell-Viewer aus der Dropdownliste Viewer die Option Microsoft Generic Content Tree Viewer aus.
Klicken Sie im Bereich Knotenbeschriftung auf den obersten Knoten (Alle).
Zeigen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.
Dieser Wert zeigt an, welche Reihe oder Kombination von Produkt und Region in diesem Knoten enthalten ist. Im AdventureWorks-Beispiel beinhaltet der oberste Knoten die Reihe M200 Europe.
Suchen Sie im Bereich Knotenbeschriftung den ersten Knoten, der über untergeordnete Knoten verfügt.
Wenn ein Reihenknoten über untergeordnete Knoten verfügt, verfügt die Strukturansicht, die auf der Registerkarte Modell des Microsoft Time Series-Viewers angezeigt wird, ebenfalls über eine Verzweigungsstruktur.
Erweitern Sie den Knoten, und klicken Sie auf einen der untergeordneten Knoten.
Die Spalte NODE_DESCRIPTION des Schemas enthält die Bedingung, die zur Teilung der Struktur führte.
Klicken Sie im Bereich Knotenbeschriftung auf den obersten ARIMA-Knoten, und erweitern Sie den Knoten, bis alle untergeordneten Knoten sichtbar sind.
Zeigen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.
Dieser Wert sagt Ihnen, welche Zeitreihe in diesem Knoten enthalten ist. Der oberste Knoten im Abschnitt ARIMA sollte mit dem obersten Knoten im Abschnitt (Alle) übereinstimmen. Im AdventureWorks-Beispiel enthält dieser Knoten die ARIMA-Analyse für die Reihe M200 Europe.
Weitere Informationen finden Sie unter Miningmodellinhalt von Zeitreihenmodellen (Analysis Services – Data Mining).
Zurück zum Anfang
Nächste Aufgabe in der Lektion
Erstellen von Zeitreihenvorhersagen (Data Mining-Lernprogramm für Fortgeschrittene)