Freigeben über


Bike Buyer-Lernprogramm zur DMX-Abfragesprache

In diesem Lernprogramm erfahren Sie, wie Miningmodelle mithilfe der Abfragesprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellt, trainiert und analysiert werden. Anschließend verwenden Sie diese Miningmodelle zum Erstellen von Vorhersagen, mit denen sich bestimmen lässt, ob ein Kunde ein Fahrrad kaufen wird.

Die Miningmodelle werden aus Daten erstellt, die in der AdventureWorksDW-Beispieldatenbank enthalten sind. In dieser Datenbank werden Daten für das fiktive Unternehmen Adventure Works Cycles gespeichert. Adventure Works Cycles ist ein großer, multinationaler Hersteller. Das Unternehmen fertigt und verkauft Fahrräder aus Metall und Verbundwerkstoffen auf dem nordamerikanischen, europäischen und asiatischen Markt. Der Hauptsitz befindet sich mit 290 Mitarbeitern in Bothell, Washington. Darüber hinaus sind mehrere regionale Vertriebsteams über die internationalen Zielmärkte des Unternehmens hinweg verteilt. Weitere Informationen zur AdventureWorksDW-Beispieldatenbank finden Sie unter Data Warehouse-Beispiel für AdventureWorks.

Lernprogrammszenario

Das Unternehmen Adventure Works Cycles hat entschieden, seine Datenanalyse auszuweiten. Dazu soll eine benutzerdefinierte Anwendung erstellt werden, die Data Mining-Funktionalität verwendet. Das Unternehmen erwartet von dieser benutzerdefinierten Anwendung, dass sie folgende Aufgaben ausführen kann:

  • Spezifische Merkmale eines potenziellen Kunden erfassen und vorhersagen, ob der Kunde ein Fahrrad kaufen wird.

  • Eine Liste potenzieller Kunden erstellen, spezifische Merkmale dieser Kunden erfassen und vorhersagen, welche Kunden ein Fahrrad kaufen werden.

Im ersten Fall werden Kundendaten von einer Kundenregistrierungsseite bereitgestellt, im zweiten Fall stellt die Marketingabteilung von Adventure Works Cycles eine Liste potenzieller Kunden zur Verfügung.

Darüber hinaus möchte die Marketingabteilung über die Möglichkeit verfügen, vorhandene Kunden in Kategorien zu gruppieren, die auf Merkmalen wie Wohnort, Anzahl der Kinder und Arbeitsweg basieren. Die Mitarbeiter der Marketingabteilung möchten untersuchen, ob mithilfe dieser Cluster bestimmte Kundengruppen gezielt angesprochen werden können. Dies erfordert ein zusätzliches Miningmodell.

MicrosoftSQL ServerAnalysis Services stellt mehrere Tools bereit, mit denen folgende Aufgaben ausgeführt werden können:

Data Mining-Erweiterungen (DMX) ist eine von Analysis Services bereitgestellte Abfragesprache, mit der Sie Miningmodelle erstellen und die Sie zum Arbeiten mit Mining-Modellen verwenden können. Der Microsoft Decision Trees-Algorithmus erstellt Modelle, mit denen sich vorhersagen lässt, ob eine Person ein Fahrrad kaufen wird. Das resultierende Modell akzeptiert als Eingabe einen einzelnen Kunden oder eine Tabelle mit Kunden. Der Microsoft Clustering-Algorithmus kann Gruppierungen von Kunden auf der Basis gemeinsamer Merkmale erstellen. Ziel dieses Lernprogramms ist es, die DMX-Skripts bereitzustellen, die in der benutzerdefinierten Anwendung verwendet werden.

Weitere Informationen:Data Mining-Projekte (Analysis Services - Data Mining)

Miningstruktur und Miningmodelle

Bevor Sie mit dem Erstellen von DMX-Anweisungen beginnen, sollten Sie sich mit dem wichtigsten Objekten vertraut machen, die von Analysis Services zum Erstellen von Miningmodellen verwendet werden. Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden. Ein Miningmodell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.

Miningmodelle müssen die in der Miningstruktur beschriebene Schlüsselspalte sowie eine Teilmenge der übrigen Spalten enthalten. Das Miningmodell definiert die Verwendung jeder einzelnen Spalte und den zum Erstellen des Miningmodells verwendeten Algorithmus. Beispiel: Sie können in DMX angeben, dass eine Spalte eine Schlüsselspalte oder ein PREDICT-Spalte ist. Eine Spalte, für die kein Typ angegeben ist, wird als Eingabespalte behandelt.

Es gibt in DMX zwei Möglichkeiten, Miningmodelle zu erstellen. Sie können die Mininstruktur und das zugehörige Miningmodell entweder zusammen mithilfe der CREATE MINING MODEL-Anweisung erstellen, oder Sie können zuerst mithilfe der CREATE MINING STRUCTURE-Anweisung eine Miningstruktur erstellen und dann der Miningstruktur mithilfe der ALTER STRUCTURE-Anweisung ein Miningmodell hinzufügen. Eine Beschreibung dieser Methoden finden Sie in der folgenden Tabelle.

  • CREATE MINING MODEL
    Verwenden Sie diese Anweisung, um eine Miningstruktur und ihr zugehöriges Miningmodell (unter Verwendung desselben Namens) zusammen zu erstellen. An den Namen des Miningmodells wird "Structure" angefügt, um es von der Miningstruktur zu unterscheiden. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen, die ein einzelnes Miningmodell enthalten wird.

    Weitere Informationen finden Sie unter CREATE MINING MODEL (DMX).

  • ALTER MINING STRUCTURE
    Verwenden Sie diese Anweisung, um einer Miningstruktur, die bereits auf dem Server vorhanden ist, ein Miningmodell hinzuzufügen. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen möchten, die mehrere unterschiedliche Miningmodelle enthält. Es kann mehrere Gründe geben, warum Sie einer einzelnen Miningstruktur mehr als nur ein Miningmodell hinzufügen sollten. Ein Grund könnte beispielsweise sein, dass Sie mehrere Miningmodelle mithilfe unterschiedlicher Algorithmen erstellen möchten, um herauszufinden, mit welchem Algorithmus die besten Ergebnisse erzielt werden. Oder Sie möchten beispielsweise mehrere Miningmodelle mithilfe desselben Algorithmus erstellen, einen Parameter für jedes Miningmodell jedoch anders festlegen, um die beste Einstellung für den Parameter zu ermitteln.

    Weitere Informationen finden Sie unter ALTER MINING STRUCTURE (DMX).

Da Sie eine Miningstruktur erstellen werden, die mehrere Miningmodelle beinhaltet, verwenden Sie in diesem Lernprogramm die zweite Methode.

Weitere Informationen

Data Mining-Erweiterungen (DMX) - Referenz, Grundlegendes zur SELECT-Anweisung (DMX), Vorhersageabfragen (DMX)

Lernziele

Dieses Lernprogramm ist in die vier folgenden Lektionen aufgeteilt:

Anforderungen

Stellen Sie vor dem Durchführen des Lernprogramms sicher, dass Folgendes installiert ist:

  • MicrosoftSQL Server

  • MicrosoftSQL Server 2005 Analysis Services (SSAS) oder SQL Server 2008 Analysis Services (SSAS)

  • Die im Lieferumfang von SQL Server enthaltene AdventureWorks-Datenbank. Aus Sicherheitsgründen werden die Beispieldatenbanken nicht standardmäßig installiert. Um offizielle Beispieldatenbanken für MicrosoftSQL Server zu installieren, rufen Sie die Seite Microsoft SQL Sample Databases auf, und wählen Sie die Datenbanken aus, die Sie installieren möchten. Weitere Informationen zum Installieren der Beispieldatenbanken finden Sie unter Erstinstallation (Analysis Services).

HinweisHinweis

Zur besseren Anzeige der Lernprogramme empfehlen wir Ihnen, dass Sie der Symbolleiste in der Dokumentanzeige die Schaltflächen Nächstes Thema und Vorheriges Thema hinzufügen. Weitere Informationen finden Sie unter Erweitern der Hilfe um die Schaltflächen Weiter und Zurück.