Miningstrukturen (Analysis Services)
In Microsoft SQL Server 2005 Analysis Services (SSAS) gibt es mehrere Objekte, die am Data Mining beteiligt sind. Die zwei primären Objekte, die verwendet werden, sind die folgenden:
- Data Mining-Struktur
- Data Mining-Modell
Zu den anderen Objekten, die am Data Mining beteiligt sind, zählen Miningstrukturspalten und Miningmodellspalten. Weitere Informationen zu diesen Objekten finden Sie unter Miningstrukturspalten und unter Miningmodellspalten.
Data Mining-Struktur
Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden.
Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.
Eine Miningstruktur kann auch geschachtelte Tabellen enthalten. Eine geschachtelte Tabelle stellt eine 1:n-Beziehung zwischen der Entität eines Falls und der damit verknüpften Attribute dar. Bei Informationen beispielsweise, die beschreiben, dass sich ein Kunde in einer Tabelle und die Einkäufe des Kunden in einer anderen Tabelle befinden, können Sie geschachtelte Tabellen verwenden, um die Informationen in einem einzelnen Fall zu kombinieren. Der Kundenbezeichner ist die Entität, und die Einkäufe sind die verknüpften Attribute. Weitere Informationen zum Verwenden von geschachtelten Tabellen finden Sie unter Geschachtelte Tabellen.
In der Miningstruktur sind keine Informationen über die Verwendung der Spalten für bestimmte Miningmodelle enthalten, und auch keine Informationen über den Algorithmustyp, der zum Erstellen eines Modells verwendet wird. Diese Informationen werden im Miningmodell selbst definiert.
Data Mining-Modell
Ein Data Mining-Modell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird. Im Miningmodell sind, wie in der Miningstruktur, Spalten enthalten. Ein Miningmodell befindet sich innerhalb der Miningstruktur und erbt alle Werte der durch die Miningstruktur definierten Eigenschaften. Das Modell kann alle Spalten oder eine Teilmenge der Spalten der Miningstruktur enthalten.
Neben den Parametern, die in der Miningstruktur definiert sind, enthält das Miningmodell zwei Eigenschaften: Algorithm und Usage. Der algorithm-Parameter ist im Miningmodell definiert, und der usage-Parameter in der Miningmodellspalte. Eine Beschreibung zu diesen Parametern finden Sie in der folgenden Tabelle.
- algorithm
Eine Modelleigenschaft, die den Algorithmus definiert, der zum Erstellen des Modells verwendet wird.
- usage
Eine Modellspalteneigenschaft, die die Verwendung einer Spalte im Modell definiert. Sie können Spalten als Eingabe-, Schlüssel- oder als vorhersagbare Spalten definieren.
Beim Data Mining-Modell handelt es sich lediglich um ein leeres Objekt, bis es verarbeitet wird. Wenn Sie ein Modell verarbeiten, werden die durch die Struktur definierten Daten an den Algorithmus übergeben. Der Algorithmus identifiziert Regeln und Muster innerhalb der Daten und verwendet dann diese zum Auffüllen des Modells. Weitere Informationen zum Verwenden von Algorithmen zum Erstellen von Miningmodellen finden Sie unter Data Mining-Algorithmen.
Nachdem Sie ein Modell verarbeitet haben, können Sie es mithilfe der in Business Intelligence Development Studio und in SQL Server Management Studio bereitgestellten benutzerdefinierten Viewer durchsuchen. Sie können auch das Modell abfragen, um Vorhersagen durchzuführen. Weitere Informationen zu benutzerdefinierten Viewern in Analysis Services finden Sie unter Anzeigen eines Data Mining-Modells.
Sie können mehrere Modelle erstellen, die auf derselben Struktur basieren. Modelle, die mit derselben Struktur erstellt wurden, müssen von derselben Datenquelle sein. Jedoch können sich die Modelle darin unterscheiden, welche Spalten der Struktur verwendet werden, wie die Spalten verwendet werden, im Algorithmustyp, der zum Erstellen der einzelnen Modelle verwendet wird, und in den Parametereinstellungen für jeden Algorithmus. Sie können z. B. eine separate Entscheidungsstruktur und eigene Clusteringmodelle erstellen, die alle verschiedene Spalten der Struktur enthalten und zur Ausführung unterschiedlicher Geschäftsaufgaben verwendet werden.
Siehe auch
Aufgaben
Vorgehensweise: Hinzufügen eines Miningmodells zu einer vorhandenen Miningstruktur
Vorgehensweise: Erstellen einer neuen relationalen Miningstruktur
Vorgehensweise: Verarbeiten eines Miningmodells
Konzepte
Analysis Services-Objekte
Data Mining-Konzepte
Miningmodellspalten
Andere Ressourcen
Building Data Mining Models
Miningstrukturspalten