Freigeben über


Bike Buyer-Lernprogramm zur DMX-Abfragesprache

 

Gilt für: SQL Server 2016 Preview

In diesem Lernprogramm erfahren Sie, wie Miningmodelle mithilfe der Abfragesprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellt, trainiert und analysiert werden. Anschließend verwenden Sie diese Miningmodelle zum Erstellen von Vorhersagen, mit denen sich bestimmen lässt, ob ein Kunde ein Fahrrad kaufen wird.

Die Miningmodelle erstellt werden die Daten aus der AdventureWorksDW2012 -Beispieldatenbank, die Daten für das fiktive Unternehmen gespeichert Adventure Works Cycles. Adventure Works Cycles ist ein großes, multinationales Produktionsunternehmen. Das Unternehmen fertigt und verkauft Fahrräder aus Metall und Verbundwerkstoffen auf dem nordamerikanischen, europäischen und asiatischen Markt. Der Hauptsitz befindet sich in Bothell, Washington, mit 290 Mitarbeitern und es sind mehrere regionale befindet sich über die internationalen Zielmärkte. Weitere Informationen zu den AdventureWorksDW2012 Beispieldatenbank, finden Sie unter Data Mining-Lösungen.

Lernprogrammszenario

Adventure Works Cycles hat entschieden, seine Datenanalyse auszuweiten, durch das Erstellen einer benutzerdefinierten Anwendung, die Datamining-Funktion verwendet. Das Unternehmen erwartet von dieser benutzerdefinierten Anwendung, dass sie folgende Aufgaben ausführen kann:

  • Spezifische Merkmale eines potenziellen Kunden erfassen und vorhersagen, ob der Kunde ein Fahrrad kaufen wird.

  • Eine Liste potenzieller Kunden erstellen, spezifische Merkmale dieser Kunden erfassen und vorhersagen, welche Kunden ein Fahrrad kaufen werden.

Im ersten Fall werden Kundendaten von einer Kundenregistrierungsseite bereitgestellt, im zweiten Fall stellt die Marketingabteilung von Adventure Works Cycles eine Liste potenzieller Kunden zur Verfügung.

Darüber hinaus möchte die Marketingabteilung über die Möglichkeit verfügen, vorhandene Kunden in Kategorien zu gruppieren, die auf Merkmalen wie Wohnort, Anzahl der Kinder und Arbeitsweg basieren. Die Mitarbeiter der Marketingabteilung möchten untersuchen, ob mithilfe dieser Cluster bestimmte Kundengruppen gezielt angesprochen werden können. Dies erfordert ein zusätzliches Miningmodell.

Microsoft SQL Server Analysis Services bietet mehrere Tools, die für diese Aufgaben verwendet werden können:

Data Mining-Erweiterungen (DMX) ist eine von Analysis Services bereitgestellte Abfragesprache, mit der Sie Miningmodelle erstellen und die Sie zum Arbeiten mit Mining-Modellen verwenden können. Der Microsoft Decision Trees-Algorithmus erstellt Modelle, mit denen sich vorhersagen lässt, ob eine Person ein Fahrrad kaufen wird. Das resultierende Modell akzeptiert als Eingabe einen einzelnen Kunden oder eine Tabelle mit Kunden. Der Microsoft Clustering-Algorithmus kann Gruppierungen von Kunden auf der Basis gemeinsamer Merkmale erstellen. Ziel dieses Lernprogramms ist es, die DMX-Skripts bereitzustellen, die in der benutzerdefinierten Anwendung verwendet werden.

Weitere Informationen:Data Mining-Lösungen

Miningstruktur und Miningmodelle

Bevor Sie mit dem Erstellen von DMX-Anweisungen beginnen, sollten Sie sich mit dem wichtigsten Objekten vertraut machen, die von Analysis Services zum Erstellen von Miningmodellen verwendet werden. Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden. Ein Miningmodell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.

Miningmodelle müssen die in der Miningstruktur beschriebene Schlüsselspalte sowie eine Teilmenge der übrigen Spalten enthalten. Das Miningmodell definiert die Verwendung jeder einzelnen Spalte und den zum Erstellen des Miningmodells verwendeten Algorithmus. Beispiel: Sie können in DMX angeben, dass eine Spalte eine Schlüsselspalte oder ein PREDICT-Spalte ist. Eine Spalte, für die kein Typ angegeben ist, wird als Eingabespalte behandelt.

Es gibt in DMX zwei Möglichkeiten, Miningmodelle zu erstellen. Sie können die Mininstruktur und das zugehörige Miningmodell entweder zusammen mithilfe der CREATE MINING MODEL-Anweisung erstellen, oder Sie können zuerst mithilfe der CREATE MINING STRUCTURE-Anweisung eine Miningstruktur erstellen und dann der Miningstruktur mithilfe der ALTER STRUCTURE-Anweisung ein Miningmodell hinzufügen. Eine Beschreibung dieser Methoden finden Sie in der folgenden Tabelle.

CREATE MINING MODEL
Verwenden Sie diese Anweisung, um eine Miningstruktur und ihr zugehöriges Miningmodell (unter Verwendung desselben Namens) zusammen zu erstellen. An den Namen des Miningmodells wird "Structure" angefügt, um es von der Miningstruktur zu unterscheiden. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen, die ein einzelnes Miningmodell enthält.

Weitere Informationen finden Sie unter CREATE MINING MODEL (DMX).

ALTER MINING STRUCTURE
Verwenden Sie diese Anweisung, um einer Miningstruktur ein Miningmodell hinzuzufügen, das bereits auf dem Server vorhanden ist. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen möchten, die mehrere unterschiedliche Miningmodelle enthält. Es kann mehrere Gründe geben, warum Sie einer einzelnen Miningstruktur mehr als nur ein Miningmodell hinzufügen sollten. Ein Grund könnte beispielsweise sein, dass Sie mehrere Miningmodelle mithilfe unterschiedlicher Algorithmen erstellen möchten, um herauszufinden, mit welchem Algorithmus die besten Ergebnisse erzielt werden. Oder Sie möchten beispielsweise mehrere Miningmodelle mithilfe desselben Algorithmus erstellen, einen Parameter für jedes Miningmodell jedoch anders festlegen, um die beste Einstellung für den Parameter zu ermitteln.

Weitere Informationen finden Sie unter ALTER MINING STRUCTURE ( DMX ).

Da Sie eine Miningstruktur erstellen, die mehrere Miningmodelle beinhaltet, verwenden Sie in diesem Lernprogramm die zweite Methode.

Weitere Informationen

Datamining-Erweiterungen ( DMX ) Referenz, Verständnis der DMX Select-Anweisung, Struktur und Verwendung der DMX-Vorhersageabfragen

Lernziele

Dieses Lernprogramm ist in die folgenden Lektionen aufgeteilt:

Lektion 1: Erstellen der Bike Buyer-Miningstruktur
In dieser Lektion lernen Sie, wie Sie die Erstellen -Anweisung Miningstrukturen erstellt.

Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur
In dieser Lektion lernen Sie, wie Sie die ALTER -Anweisung eine Miningstruktur Miningmodelle hinzugefügt.

Lektion 3: Verarbeiten der Bike Buyer-Miningstruktur
In dieser Lektion erfahren Sie, wie Sie die INSERT INTO -Anweisung Miningstrukturen und ihre zugehörigen Miningmodelle verarbeitet.

Lektion 4: Durchsuchen des Bike Buyer-Miningmodells
In dieser Lektion lernen Sie, wie Sie die auswählen Anweisung zum Untersuchen des Inhalts der Miningmodelle.

Lektion 5: Ausführen von Vorhersageabfragen
In dieser Lektion lernen Sie, wie Sie die PREDICTION JOIN -Anweisung Vorhersagen für Miningmodelle erstellen.

Anforderungen

Stellen Sie vor dem Durchführen des Lernprogramms sicher, dass Folgendes installiert ist:

  • Microsoft SQL Server

  • Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS), SQL Server 2016 Analysis Services (SSAS), or SQL Server Analysis Services

  • Die AdventureWorksDW2012-Datenbank. Aus Sicherheitsgründen werden die Beispieldatenbanken standardmäßig nicht installiert. So installieren Sie die offiziellen Beispieldatenbanken für Microsoft SQL Server, besuchen Sie die Microsoft SQL Sample Databases Seite und wählen Sie die Datenbanken, die Sie installieren möchten. Weitere Informationen zum Installieren der Beispieldatenbanken finden Sie unter Erstinstallation (Analysis Services).

Siehe auch

Market Basket DMX-Lernprogramm
Lernprogramm zu Data Mining-Grundlagen