Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In dieser Aufgabe erstellen Sie ein neues Modell basierend auf weltweiten Umsatzdaten. Anschließend erstellen Sie eine Vorhersageabfrage, die das weltweite Vertriebsmodell auf eine der einzelnen Regionen anwendet.
Erstellen eines allgemeinen Modells
Denken Sie daran, dass Ihre Analyse der Ergebnisse des ursprünglichen Miningmodells große Unterschiede zwischen Regionen und zwischen Produktlinien ergab. Beispielsweise waren die Verkäufe in Nordamerika stark für das M200-Modell, während der Verkauf des T1000-Modells nicht so gut funktionierte. Die Analyse ist jedoch kompliziert durch die Tatsache, dass einige Datenreihen nicht viel Daten hatten oder Daten zu einem anderen Zeitpunkt begonnen haben. Einige Daten fehlen ebenfalls.
Um einige der Probleme mit der Datenqualität zu beheben, entscheiden Sie sich für die Zusammenführung der Daten aus Verkäufen auf der ganzen Welt, und verwenden Sie diese Gruppe allgemeiner Verkaufstrends, um ein Modell zu erstellen, das angewendet werden kann, um zukünftige Umsätze in jeder Region vorherzusagen.
Wenn Sie Vorhersagen erstellen, verwenden Sie das Muster, das durch Schulungen zu weltweiten Umsatzdaten generiert wird, aber Sie ersetzen die historischen Datenpunkte durch die Umsatzdaten für jede einzelne Region. Auf diese Weise wird die Form des Trends beibehalten, aber die vorhergesagten Werte werden an die historischen Verkaufszahlen für jede Region und jedes Modell angepasst.
Durchführen von Kreuzvorhersagen mit einem Zeitreihenmodell
Der Prozess der Verwendung von Daten aus einer Datenreihe zum Vorhersagen von Trends in einer anderen Datenreihe wird als Kreuzvorhersage bezeichnet. Sie können die Kreuzvorhersage in vielen Szenarien verwenden: Sie können z. B. entscheiden, dass die Fernsehverkäufe ein guter Prädiktor für die gesamtwirtschaftliche Aktivität sind, und ein Modell anwenden, das auf den Fernsehverkäufen auf allgemeine Wirtschaftsdaten trainiert wurde.
In SQL Server Data Mining führen Sie Quervergleiche mithilfe des Parameters REPLACE_MODEL_CASES als Argumente der Funktion PredictTimeSeries (DMX) durch.
In der nächsten Aufgabe erfahren Sie, wie Sie REPLACE_MODEL_CASES verwenden. Sie verwenden die zusammengeführten World Sales Data, um ein Modell zu erstellen und dann eine Vorhersageabfrage zu erstellen, die das allgemeine Modell den Ersatzdaten zuordnet.
Es wird davon ausgegangen, dass Sie bereits mit dem Erstellen von Data Mining-Modellen vertraut sind und daher die Anweisungen zum Erstellen des Modells vereinfacht wurden.
Erstellen Sie eine Miningstruktur und ein Miningmodell mithilfe der aggregierten Daten
Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie dann "Neue Miningstruktur " aus, um den Data Mining-Assistenten zu starten.
Treffen Sie im Data Mining-Assistent die folgenden Optionen:
Algorithmus: Microsoft Time Series
Verwenden Sie die Datenquelle, die Sie zuvor in dieser erweiterten Lektion erstellt haben, als Quelle für das Modell. Weitere Informationen finden Sie unter Advanced Time Series Predictions (Intermediate Data Mining Tutorial).
Datenquellenansicht:
AllRegionsWählen Sie die folgenden Spalten für den Serienschlüssel und den Zeitschlüssel aus:
Schlüsselzeit: Berichtsdatum
Schlüssel: Region
Wählen Sie die folgenden Spalten für
InputundPredict:Summensumme
SumAmt
AvgAmt
AvgQty
Geben Sie für den Namen der Miningstruktur Folgendes ein:
All RegionsGeben Sie für den Namen des Miningmodells Folgendes ein:
All Regions
Verarbeiten sie die neue Struktur und das neue Modell.
So erstellen Sie die Vorhersageabfrage und ordnen die Ersatzdaten zu
Wenn das Modell noch nicht geöffnet ist, doppelklicken Sie auf die AllRegions-Struktur, und klicken Sie im Data Mining-Designer auf die Registerkarte "Miningmodellvorhersage ".
Im Bereich "Miningmodell " sollte das Modell "AllRegions" bereits ausgewählt sein. Wenn sie nicht ausgewählt ist, klicken Sie auf "Modell auswählen", und wählen Sie dann das Modell "AllRegions" aus.
Klicken Sie im Bereich "Eingabetabelle(n) auswählen " auf " Falltabelle auswählen".
Ändern Sie im Dialogfeld "Tabelle auswählen " die Datenquelle in "T1000 Pacific Region", und klicken Sie dann auf "OK".
Klicken Sie mit der rechten Maustaste auf die Verknüpfungslinie zwischen dem Miningmodell und den Eingabedaten, und wählen Sie "Verbindungen ändern" aus. Ordnen Sie die Daten in der Datenquellenansicht wie folgt dem Modell zu:
Stellen Sie sicher, dass die Spalte "ReportingDate" im Miningmodell der Spalte "ReportingDate" in den Eingabedaten zugeordnet ist.
Klicken Sie im Dialogfeld "Zuordnung ändern " in der Zeile für die Modellspalte "AvgQty" unter "Tabellenspalte ", und wählen Sie dann "T1000 Pacific.Quantity" aus. Klicke auf OK.
In diesem Schritt wird die Spalte, die Sie im Modell für die Vorhersage der durchschnittlichen Menge erstellt haben, den tatsächlichen Daten der T1000-Serie für die Verkaufsmenge zugeordnet.
Ordnen Sie die Spaltenregion im Modell keiner Eingabespalte zu.
Da das Modell die Daten über alle Datenreihen hinweg aggregiert hat, gibt es keine Übereinstimmung für die Datenreihenwerte wie T1000 Pacific, und ein Fehler wird ausgelöst, wenn die Vorhersageabfrage ausgeführt wird.
Jetzt erstellen Sie die Vorhersageabfrage.
Fügen Sie zunächst eine Spalte zu den Ergebnissen hinzu, die die Beschriftung "AllRegions" aus dem Modell zusammen mit den Vorhersagen ausgibt. Auf diese Weise wissen Sie, dass die Ergebnisse auf dem allgemeinen Modell basieren.
Klicken Sie im Raster auf die erste leere Zeile unter "Quelle", und wählen Sie dann das Miningmodell "AllRegions" aus.
Wählen Sie für "Feld" die Option "Region" aus.
Geben Sie für Alias das verwendete Modell ein.
Fügen Sie als Nächstes eine weitere Beschriftung zu den Ergebnissen hinzu, damit Sie sehen können, für welche Datenreihe die Vorhersage gilt.
Klicken Sie auf eine leere Zeile, und wählen Sie unter "Quelle" den Eintrag "Benutzerdefinierter Ausdruck" aus.
Geben Sie in der Spalte AliasModelRegion ein.
Geben Sie
'T1000 Pacific'in die Spalte "Kriterien/Argument" ein.
Jetzt richten Sie die Kreuzvorhersagefunktion ein.
Klicken Sie auf eine leere Zeile, und wählen Sie unter "Quelle" die Option "Vorhersagefunktion" aus.
Wählen Sie in der Spalte "Feld " die Option "PredictTimeSeries" aus.
Geben Sie für Aliasdie Vorhersagewerte ein.
Ziehen Sie das Feld "AvgQty" aus dem Bereich "Miningmodell " in die Spalte "Kriterien/Argument ", indem Sie den Drag-and-Drop-Vorgang verwenden.
Geben Sie in der Spalte "Kriterien/Argument " nach dem Feldnamen den folgenden Text ein:
,5, REPLACE_MODEL_CASESDer vollständige Text des Textfelds "Kriterien/Argument " sollte wie folgt sein:
[AllRegions].[AvgQty],5,REPLACE_MODEL_CASES
Klicken Sie auf "Ergebnisse".
Erstellen der Kreuzvorhersageabfrage in DMX
Möglicherweise haben Sie ein Problem mit der Kreuzvorhersage festgestellt: Nämlich, dass das allgemeine Modell auf eine andere Datenreihe angewendet werden soll, z. B. das Produktmodell T1000 in der Region Nordamerika, müssen Sie eine andere Abfrage für jede Datenreihe erstellen, damit Sie die einzelnen Eingaben dem Modell zuordnen können.
Anstatt jedoch die Abfrage im Designer zu erstellen, können Sie zur DMX-Ansicht wechseln und die DMX-Anweisung, die Sie erstellt haben, bearbeiten. Folgender DMX-Befehl stellt die Abfrage dar, die Sie gerade erstellt haben:
SELECT
([All Regions].[Region]) as [Model Used],
('T-1000 Pacific') as [ModelRegion],
(PredictTimeSeries([All Regions].[Avg Qty],5, REPLACE_MODEL_CASES)) as [Predicted Quantity]
FROM [All Regions]
PREDICTION JOIN
OPENQUERY([Adventure Works DW2003R2], 'SELECT [ReportingDate] FROM
(
SELECT ReportingDate, ModelRegion, Quantity, Amount
FROM dbo.vTimeSeries
WHERE (ModelRegion = N''T1000 Pacific'')
) as [T1000 Pacific] ')
AS t
ON
[All Regions].[Reporting Date] = t.[ReportingDate]
AND
[All Regions].[Avg Qty] = t.[Quantity]
Um dies auf ein anderes Modell anzuwenden, bearbeiten Sie einfach die Abfrageaufweisung, um die Filterbedingung zu ersetzen und die bezeichnungen zu aktualisieren, die den einzelnen Ergebnissen zugeordnet sind.
Wenn Sie beispielsweise die Filterbedingungen und Spaltenbeschriftungen ändern, indem Sie "Pacific" durch "Nordamerika" ersetzen, erhalten Sie Vorhersagen für das T1000-Produkt in Nordamerika, basierend auf den Mustern im allgemeinen Modell.
Nächste Aufgabe in der Lektion
Vergleich von Vorhersagen für Prognosemodelle (Tutorial für fortgeschrittenes Data Mining)
Siehe auch
Abfragebeispiele für Zeitreihenmodelle
PredictTimeSeries (DMX)