Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Die Miningstruktur definiert die Daten, aus denen Miningmodelle erstellt werden: Sie gibt die Quelldatenansicht, die Anzahl und den Spaltentyp sowie eine optionale Partition in Schulungs- und Testsätze an. Eine einzelne Miningstruktur kann mehrere Miningmodelle unterstützen, die dieselbe Domäne gemeinsam nutzen. Das folgende Diagramm veranschaulicht die Beziehung der Data Mining-Struktur zur Datenquelle und zu den zugehörigen Data Mining-Modellen.
Die Miningstruktur im Diagramm basiert auf einer Datenquelle, die mehrere Tabellen oder Ansichten enthält, die mit dem Feld "CustomerID" verknüpft sind. Eine Tabelle enthält Informationen zu Kunden, z. B. der geografischen Region, dem Alter, dem Einkommen und dem Geschlecht, während die zugehörige geschachtelte Tabelle mehrere Zeilen mit zusätzlichen Informationen zu jedem Kunden enthält, z. B. Produkte, die der Kunde erworben hat. Das Diagramm zeigt, dass mehrere Modelle auf einer Miningstruktur erstellt werden können und dass die Modelle unterschiedliche Spalten aus der Struktur verwenden können.
Modell 1 verwendet CustomerID, Einkommen, Alter, Region und filtert die Daten anhand der Region.
Modell 2 Verwendet "CustomerID", "Einkommen", "Alter", "Region" und filtert die Daten nach "Alter".
Modell 3 Verwendet CustomerID, Age, Gender und die geschachtelte Tabelle ohne Filter.
Da die Modelle unterschiedliche Spalten für die Eingabe verwenden und zwei der Modelle zusätzlich die daten einschränken, die im Modell verwendet werden, indem sie einen Filter anwenden, haben die Modelle möglicherweise sehr unterschiedliche Ergebnisse, obwohl sie auf denselben Daten basieren. Beachten Sie, dass die Spalte "CustomerID" in allen Modellen erforderlich ist, da es sich um die einzige verfügbare Spalte handelt, die als Fallschlüssel verwendet werden kann.
In diesem Abschnitt wird die grundlegende Architektur von Data Mining-Strukturen erläutert: wie Sie eine Miningstruktur definieren, wie Sie sie mit Daten auffüllen und wie Sie sie zum Erstellen von Modellen verwenden. Weitere Informationen zum Verwalten oder Exportieren vorhandener Data Mining-Strukturen finden Sie unter Verwaltung von Data Mining-Lösungen und -Objekten.
Definieren einer Bergbaustruktur
Das Einrichten einer Data Mining-Struktur umfasst die folgenden Schritte:
Definieren sie eine Datenquelle.
Wählen Sie Spalten mit Daten aus, die in die Struktur aufgenommen werden sollen (nicht alle Spalten müssen dem Modell hinzugefügt werden), und definieren Sie einen Schlüssel.
Definieren Sie einen Schlüssel für die Struktur, einschließlich des Schlüssels für die am besten geeignete Tabelle, falls zutreffend.
Geben Sie an, ob die Quelldaten in einen Schulungssatz und Testsatz getrennt werden sollen. Dieser Schritt ist optional.
Bearbeite die Struktur.
Diese Schritte werden in den folgenden Abschnitten ausführlicher beschrieben.
Datenquellen für Miningstrukturen
Wenn Sie eine Miningstruktur definieren, verwenden Sie Spalten, die in einer vorhandenen Datenquellenansicht verfügbar sind. Eine Datenquellenansicht ist ein freigegebenes Objekt, mit dem Sie mehrere Datenquellen kombinieren und als einzelne Quelle verwenden können. Die ursprünglichen Datenquellen sind für Clientanwendungen nicht sichtbar, und Sie können die Eigenschaften der Datenquellenansicht verwenden, um Datentypen zu ändern, Aggregationen oder Aliasspalten zu erstellen.
Wenn Sie mehrere Miningmodelle aus derselben Miningstruktur erstellen, können die Modelle unterschiedliche Spalten aus der Struktur verwenden. Sie können z. B. eine einzelne Struktur erstellen und dann separate Entscheidungsstruktur- und Clusteringmodelle daraus erstellen, wobei jedes Modell unterschiedliche Spalten verwendet und unterschiedliche Attribute vorhergesagt hat.
Darüber hinaus kann jedes Modell die Spalten aus der Struktur auf unterschiedliche Weise verwenden. Ihre Datenquellenansicht kann z. B. eine Spalte "Einkommen" enthalten, die Sie auf unterschiedliche Weise für verschiedene Modelle speichern können.
Die Data Mining-Struktur speichert die Definition der Datenquelle und der darin enthaltenen Spalten in Form von Bindungen an die Quelldaten. Weitere Informationen zu Datenquellenbindungen finden Sie unter Datenquellen und Bindungen (SSAS Multidimensional). Beachten Sie jedoch, dass Sie auch eine Data-Mining-Struktur erstellen können, ohne sie an eine bestimmte Datenquelle zu binden, indem Sie die CREATE MINING STRUCTURE (DMX)-Anweisung verwenden.
Spalten der Miningstruktur
Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten. Die Miningstruktur enthält keine Informationen darüber, wie Spalten für ein bestimmtes Miningmodell verwendet werden, oder über den Typ des Algorithmus, der zum Erstellen eines Modells verwendet wird; diese Informationen werden im Miningmodell selbst definiert.
Eine Miningstruktur kann auch geschachtelte Tabellen enthalten. Eine geschachtelte Tabelle stellt eine eins-zu-viele-Beziehung zwischen der Entität eines Falls und den zugehörigen Attributen dar. Wenn sich beispielsweise die Informationen, die den Kunden beschreiben, in einer Tabelle befinden und sich die Einkäufe des Kunden in einer anderen Tabelle befinden, können Sie verschachtelte Tabellen verwenden, um die Informationen in einem einzigen Fall zu kombinieren. Der Kundenbezeichner ist die Entität, und die Einkäufe sind die zugehörigen Attribute. Weitere Informationen zur Verwendung geschachtelter Tabellen finden Sie unter "Geschachtelte Tabellen" (Analysis Services – Data Mining).
Zum Erstellen eines Data Mining-Modells in SQL Server Data Tools (SSDT) müssen Sie zuerst eine Data Mining-Struktur erstellen. Der Datenanalyse-Assistent führt Sie durch den Prozess der Erstellung einer Miningstruktur, der Auswahl von Daten und dem Hinzufügen eines Miningmodells.
Wenn Sie ein Mining-Modell mithilfe von Data Mining Extensions (DMX) erstellen, können Sie das Modell und die Spalten darin angeben, und DMX wird automatisch die erforderliche Miningstruktur erstellen. Weitere Informationen finden Sie unter CREATE MINING MODEL (CREATE MINING MODEL, MINING MODEL, CREATE MINING MODEL, MINING MODEL, CREATE MINING
Weitere Informationen finden Sie unter "Mining Structure Columns".
Aufteilen der Daten in Schulungs- und Testsätze
Wenn Sie die Daten für die Miningstruktur definieren, können Sie auch angeben, dass einige der Daten für Schulungen und einige für Tests verwendet werden. Daher ist es nicht mehr erforderlich, Ihre Daten vor dem Erstellen einer Data Mining-Struktur zu trennen. Während Sie Ihr Modell erstellen, können Sie stattdessen angeben, dass ein bestimmter Prozentsatz der Daten für Tests und die restlichen Für Schulungen verwendet wird, oder Sie können eine bestimmte Anzahl von Fällen angeben, die als Testdatensatz verwendet werden sollen. Die Informationen zu den Schulungs- und Testdatensätzen werden mit der Miningstruktur zwischengespeichert, und daher kann derselbe Testsatz mit allen Modellen verwendet werden, die auf dieser Struktur basieren.
Weitere Informationen finden Sie unter Schulungs- und Testdatensätze.
Aktivieren von Drillthrough
Sie können der Miningstruktur Spalten hinzufügen, auch wenn Sie nicht beabsichtigen, die Spalte in einem bestimmten Miningmodell zu verwenden. Dies ist nützlich, wenn Sie beispielsweise die E-Mail-Adressen von Kunden in einem Clusteringmodell abrufen möchten, ohne die E-Mail-Adresse während des Analysevorgangs zu verwenden. Wenn Sie eine Spalte während der Analyse- und Vorhersagephase ignorieren möchten, fügen Sie sie der Struktur hinzu, geben aber keine Verwendung für die Spalte an, oder legen Sie das Verwendungskennzeichnung auf "Ignorieren" fest. Auf diese Weise gekennzeichnete Daten können weiterhin in Abfragen verwendet werden, wenn Drillthrough für das Miningmodell aktiviert wurde und Sie über die entsprechenden Berechtigungen verfügen. Sie können beispielsweise die Cluster überprüfen, die sich aus der Analyse aller Kunden ergeben, und dann eine Drillthroughabfrage verwenden, um die Namen und E-Mail-Adressen von Kunden in einem bestimmten Cluster abzurufen, auch wenn diese Datenspalten nicht zum Erstellen des Modells verwendet wurden.
Weitere Informationen finden Sie unter Drillthrough Queries (Data Mining).
Verarbeitung von Bergbaustrukturen
Eine Miningstruktur ist nur ein Metadatencontainer, bis sie verarbeitet wird. Wenn Sie eine Miningstruktur verarbeiten, erstellt Analysis Services einen Cache, in dem Statistiken zu den Daten gespeichert werden, Informationen darüber, wie fortlaufende Attribute diskretisiert werden, und andere Informationen, die später von Miningmodellen verwendet werden. Das Miningmodell selbst speichert diese Zusammenfassungsinformationen nicht, sondern verweist stattdessen auf die Informationen, die beim Verarbeiten der Miningstruktur zwischengespeichert wurden. Daher müssen Sie die Struktur nicht jedes Mal neu verarbeiten, wenn Sie einer vorhandenen Struktur ein neues Modell hinzufügen. Sie können nur das Modell verarbeiten.
Sie können diesen Cache nach der Verarbeitung verwerfen, wenn der Cache sehr groß ist oder Sie detaillierte Daten entfernen möchten. Wenn Sie nicht möchten, dass die Daten zwischengespeichert werden, können Sie die Eigenschaft CacheMode der Miningstruktur auf ClearAfterProcessing ändern. Dadurch wird der Cache zerstört, nachdem alle Modelle verarbeitet wurden. Durch das Festlegen der CacheMode-Eigenschaft auf ClearAfterProcessing wird Drillthrough im Miningmodell deaktiviert.
Nachdem Sie den Cache zerstört haben, können Sie der Miningstruktur jedoch keine neuen Modelle hinzufügen. Wenn Sie der Struktur ein neues Miningmodell hinzufügen oder die Eigenschaften vorhandener Modelle ändern, müssen Sie zuerst die Miningstruktur neu verarbeiten. Weitere Informationen finden Sie unter Verarbeitungsanforderungen und Überlegungen (Data Mining).
Anzeigen von Bergbaustrukturen
Sie können Viewer nicht verwenden, um die Daten in einer Miningstruktur zu durchsuchen. In SQL Server Data Tools (SSDT) können Sie jedoch die Registerkarte "Miningstruktur " des Data Mining-Designers verwenden, um die Strukturspalten und deren Definitionen anzuzeigen. Weitere Informationen finden Sie im Data Mining-Designer.
Wenn Sie die Daten in der Miningstruktur überprüfen möchten, können Sie Abfragen mithilfe von Data Mining Extensions (DMX) erstellen. Die Anweisung SELECT * FROM <structure>.CASES gibt beispielsweise alle Daten in der Miningstruktur zurück. Um diese Informationen abzurufen, muss die Miningstruktur verarbeitet worden sein, und die Ergebnisse der Verarbeitung müssen zwischengespeichert werden.
Die Anweisung SELECT * FROM <model>.CASES gibt die gleichen Spalten zurück, aber nur für die Fälle in diesem bestimmten Modell. Weitere Informationen finden Sie unter SELECT FROM-Struktur<>. CASES und SELECT FROM-Modell<>. CASES (DIMM).
Verwenden von Data Mining-Modellen mit Miningstrukturen
Ein Data Mining-Modell wendet einen Miningmodellalgorithmus auf die Daten an, die durch eine Miningstruktur dargestellt werden. Ein Miningmodell ist ein Objekt, das zu einer bestimmten Miningstruktur gehört, und das Modell erbt alle Werte der Eigenschaften, die durch die Miningstruktur definiert werden. Das Modell kann alle Spalten verwenden, die die Miningstruktur enthält, oder eine Teilmenge der Spalten. Sie können einer Struktur mehrere Kopien einer Strukturspalte hinzufügen. Sie können einem Modell auch mehrere Kopien einer Strukturspalte hinzufügen und dann jeder Strukturspalte im Modell unterschiedliche Namen oder Aliase zuweisen. Weitere Informationen zu Aliasingstrukturspalten finden Sie unter Create an Alias for a Model Column and Mining Model Properties.For more information about aliasing structure columns, see Create an Alias for a Model Column and Mining Model Properties.
Weitere Informationen zur Architektur von Data Mining-Modellen finden Sie unter Mining-Modelle (Analysis Services - Data Mining).For more information about the architecture of data mining models, see Mining Models (Analysis Services - Data Mining).
Verwandte Aufgaben
Verwenden Sie die Links, die sie zur Verfügung gestellt haben, um mehr über das Definieren, Verwalten und Verwenden von Miningstrukturen zu erfahren.
| Aufgaben | Verknüpfungen |
|---|---|
| Arbeiten mit relationalen Miningstrukturen |
Erstellen einer neuen relationalen Miningstruktur Eine geschachtelte Tabelle zu einer Miningstruktur hinzufügen |
| Arbeiten mit auf OLAP-Cubes basierenden Miningstrukturen |
Erstellen einer neuen OLAP-Miningstruktur Filtern des Quellwürfels für eine Miningstruktur |
| Arbeiten mit Säulen in einer Bergbaustruktur |
Hinzufügen von Spalten zu einer Miningstruktur Entfernen von Spalten aus einer Miningstruktur |
| Ändern oder Abfragen der Miningstruktureigenschaften und -daten | Ändern der Eigenschaften einer Bergbaustruktur |
| Arbeiten mit den zugrunde liegenden Datenquellen und Aktualisieren von Quelldaten |
Bearbeiten der Datenquellenansicht, die für eine Miningstruktur verwendet wird Verarbeiten einer Bergbaustruktur |
Siehe auch
Datenbankobjekte (Analysis Services – multidimensionale Daten)
Miningmodelle für Analysis Services - Data Mining