Data Mining-Abfragen
Gilt für: SQL Server 2019 und früheren Analysis Services Azure Analysis Services Fabric/Power BI Premium
Wichtig
Data Mining wurde in SQL Server 2017 Analysis Services als veraltet eingestuft und wurde jetzt in SQL Server 2022 Analysis Services eingestellt. Die Dokumentation wird für veraltete und eingestellte Features nicht aktualisiert. Weitere Informationen finden Sie unter Abwärtskompatibilität von Analysis Services.
Data Mining-Abfragen eignen sich für viele Zwecke. Ihre Möglichkeiten:
Anwenden des Modells auf neue Daten, um einzelne oder mehrere Vorhersagen zu treffen. Sie können Eingabewerte als Parameter oder in einem Batch bereitstellen.
Abrufen einer statistischen Zusammenfassung der für das Training verwendeten Daten.
Extrahieren von Mustern und Regeln oder Generieren eines Profils des typischen Falls, der ein Muster im Modell darstellt.
Extrahieren von Regressionsformeln und anderen Berechnungen zur Erklärung von Mustern.
Abrufen der Fälle, die einem bestimmten Muster entsprechen.
Abrufen von Details zu einzelnen im Modell verwendeten Fällen, einschließlich in der Analyse nicht verwendeter Daten.
Erneutes Trainieren eines Modells durch Hinzufügen neuer Daten oder Ausführen einer Kreuzvorhersage
Dieser Abschnitt bietet eine Übersicht über die Informationen, die Sie für die ersten Schritte mit Data Mining-Abfragen benötigen. Er beschreibt die Typen von Abfragen, die Sie für Data Mining-Objekte erstellen können, bietet eine Einführung in die Abfragetools und Abfragesprachen und stellt Links zu Beispielen für Abfragen bereit, die Sie für Modelle erstellen können, die mit den in SQL Server Data Mining verfügbaren Algorithmen erstellt wurden.
Grundlegendes zu Data Mining-Abfragen
Abfragetools und -schnittstellen
Abfragen für verschiedene Modelltypen
Grundlegendes zu Data Mining-Abfragen
SQL Server Analysis Services Data Mining unterstützt die folgenden Arten von Abfragen:
Vorhersageabfragen (Data Mining)
Abfragen, mit denen Rückschlüsse anhand von Mustern im Modell und aus Eingabedaten gezogen werden können.
-
Abfragen, die Metadaten, Statistiken und andere Informationen zum Modell selbst zurückgeben.
Drillthroughabfragen (Data Mining)
Abfragen, die die zugrunde liegenden Falldaten für das Modell und sogar Daten, die nicht im Modell verwendet wurden, aus der Struktur abrufen können.
Datendefinitionsabfragen (Data Mining)
Abfragen, die keine Informationen aus dem Modell zurückgeben, sondern zum Erstellen von Modellen und Strukturen oder zum Aktualisieren der Daten in einem Modell oder einer Struktur verwendet werden.
Bevor Sie Abfragen erstellen, sollten Sie sich mit den Unterschieden zwischen den Modellen vertraut machen, die mit den verschiedenen von SQL Server bereitgestellten Data Mining-Algorithmen erstellt werden können.
Durchsuchen und untersuchen Sie jeden Modelltyp mit den benutzerdefinierten Data Mining-Viewern, die für jeden Algorithmustyp zur Verfügung stehen. Weitere Informationen finden Sie unter Tasks und Anweisungen für Miningmodell-Viewer.
Überprüfen Sie den Modellinhalt für jeden Modelltyp mit dem Microsoft Generic Content Tree Viewer. Informationen zur Interpretation dieser Informationen finden Sie unter Miningmodellinhalt (Analysis Services – Data Mining).
Abfragetools und -schnittstellen
Sie können Data Mining-Abfragen interaktiv mit einem der von SQL Server bereitgestellten Abfragetools erstellen. Der grafische Generator für Vorhersageabfragen wird sowohl in SQL Server Data Tools als auch in SQL Server Management Studio bereitgestellt. Wenn Sie den Generator für Vorhersageabfragen bisher noch nicht verwendet haben, empfehlen wir, die Schritte im Basic Data Mining Tutorial durchzuarbeiten, um sich mit der Oberfläche vertraut zu machen. Kurze Übersicht der Schritte, finden Sie unter Erstellen einer Abfrage mit der erstellt eine Vorhersage mithilfe des Generators für Vorhersageabfragen.
Der Generator für Vorhersageabfragen ist nützlich zum Erstellen grundlegender Abfragen, die Sie später weiter anpassen können. Sie können Datenquellen leicht hinzufügen und Spalten zuordnen und dann zu DMX wechseln und die Abfrage anpassen, indem Sie eine WHERE-Klausel oder andere Funktionen hinzufügen.
Sobald Sie mit den Data Mining-Modellen und dem Erstellen von Abfragen vertraut sind, können Sie die Abfragen auch direkt mithilfe der Data Mining-Erweiterungen (Data Mining Extensions, DMX) schreiben. DMX ist eine Abfragesprache, die Transact-SQL ähnelt und in vielen verschiedenen Clients verwendet werden kann. DMX ist das bevorzugte Tool zum Erstellen von benutzerdefinierten Vorhersagen und komplexen Abfragen. Eine Einführung in DMX finden Sie unter Erstellen und Abfragen von Data Mining-Modellen mit DMX: Tutorials (Analysis Services – Data Mining).
DMX-Editoren werden sowohl in SQL Server Data Tools als auch in SQL Server Management Studio bereitgestellt. Sie können Abfragen auch zunächst mit dem Generator für Vorhersageabfragen erstellen und dann zur Text-Editor-Ansicht wechseln und die DMX-Anweisung in einen anderen Client kopieren. Weitere Informationen finden Sie unter Data Mining-Abfragetools.
Sie können DMX-Anweisungen programmgesteuert erstellen und sie mithilfe von AMO oder XMLA von Ihrem Client an den SQL Server Analysis Services-Server senden. Zum Erstellen von Abfragen für ein Miningmodell müssen Sie jedoch immer DMX verwenden.
Sie können die Metadaten, Statistiken und bestimmte Inhalte des Modells auch mit dynamischen Verwaltungssichten (Dynamic Management Views, DMVs) abfragen, die auf den Data Mining-Schemarowsets basieren. DMVs erleichtern das Abrufen von Modellinformationen durch die Eingabe von SELECT-Anweisungen, unterstützten jedoch nicht das Erstellen von Vorhersagen. Weitere Informationen zu von SQL Server Analysis Services unterstützten DMVs finden Sie unter Verwenden dynamischer Verwaltungssichten (DMVs) zum Überwachen von Analysis Services.
Schließlich können Sie mithilfe von Data Mining Query Taskoder Data Mining Query TransformationData Mining-Abfragen zur Verwendung in Integration Services-Paketen erstellen. Der Ablaufsteuerungstask unterstützt mehrere Typen von DMX-Abfragen, während die Datenflusstransformation nur Abfragen unterstützt, die Daten im Datenfluss verarbeiten, d. h. Abfragen, die die PREDICTION JOIN-Syntax verwenden.
Abfragen für unterschiedliche Modelltypen
Der Algorithmus, der beim Erstellen des Modells verwendet wurde, hat großen Einfluss auf die Art von Informationen, die Sie mit einer Data Mining-Abfrage abrufen können. Der Grund für die Unterschiede ist, dass jeder Algorithmus die Daten auf eine andere Weise verarbeitet und andere Arten von Mustern speichert. Einige Algorithmen erstellen z. B. Cluster, andere erstellen Strukturen. Daher müssen Sie ggf. spezialisierte Vorhersage- und Abfragefunktionen verwenden, abhängig vom Modelltyp, mit dem Sie arbeiten.
Die folgende Liste bietet eine Zusammenfassung der Funktionen, die Sie in Abfragen verwenden können:
Allgemeine Vorhersagefunktionen: Die Predict -Funktion ist polymorph, d. h., sie kann mit allen Modelltypen verwendet werden. Diese Funktion erkennt automatisch den Modelltyp, mit dem Sie arbeiten, und fordert Sie zur Eingabe zusätzlicher Parameter auf. Weitere Informationen finden Sie unter Predict (DMX).
Warnung
Nicht alle Modelle werden verwendet, um Vorhersagen zu treffen. Beispielsweise können Sie ein Clusteringmodell erstellen, das über kein vorhersagbares Attribut verfügt. Aber selbst wenn ein Modell nicht über ein vorhersagbares Attribut verfügt, können Sie Vorhersageabfragen erstellen, die andere Typen nützlicher Informationen aus dem Modell zurückgeben.
Benutzerdefinierte Vorhersagefunktionen: Jeder Modelltyp stellt einen Satz von Vorhersagefunktionen bereit, die zum Arbeiten mit den von diesem Algorithmus erstellten Mustern entworfen wurden.
Für Zeitreihenmodelle wird z. B. die Lag -Funktion bereitgestellt, mit der Sie die Vergangenheitsdaten anzeigen können, die für das Modell verwendet wurden. Bei Clusteringmodellen liefern z. B. Funktionen wie ClusterDistance sinnvollere Informationen.
Weitere Informationen zu den Funktionen, die für jeden Modelltyp unterstützt werden, finden Sie unter den folgenden Links:
Sie können auch VBA-Funktionen aufrufen oder eigene Funktionen erstellen. Weitere Informationen finden Sie unter Funktionen (DMX).
Allgemeine Statistiken: Es gibt eine Reihe von Funktionen, die mit nahezu jedem Modelltyp verwendet werden können, der einen Standardsatz von beschreibenden Statistiken zurückgibt (z. B. die Standardabweichung).
Die PredictHistogram -Funktion gibt z. B. eine Tabelle zurück, in der alle Status der angegebenen Spalte aufgeführt sind.
Weitere Informationen finden Sie unter Allgemeine Vorhersagefunktionen (DMX).
Benutzerdefinierte Statistiken: Für jeden Modelltyp werden zusätzliche unterstützende Funktionen bereitgestellt, um Statistiken zu generieren, die für die spezifische analytische Aufgabe relevant sind.
Wenn Sie z. B. mit einem Clusteringmodell arbeiten, können Sie die PredictCaseLikelihood-Funktion verwenden, um das einem bestimmten Fall und Cluster zugeordnete Wahrscheinlichkeitsergebnis zurückzugeben. Wenn Sie hingegen ein lineares Regressionsmodell erstellen, ist das Abrufen und Abfangen des Koeffizienten von größerer Bedeutung. In diesem Fall können Sie eine Inhaltsabfrage verwenden.
Funktionen für den Modellinhalt: Der Inhalt aller Modelle wird in einem standardisierten Format dargestellt, aus dem Sie mit einer einfachen Abfrage Informationen abrufen können. Zum Erstellen von Abfragen für den Modellinhalt verwenden Sie DMX. Einige Modellinhaltstypen können Sie auch mithilfe der Data Mining-Schemarowsets abfragen.
Im Modellinhalt ist die Bedeutung jeder Zeile bzw. jedes Knoten der Tabelle, die zurückgegeben wird, abhängig vom Typ des Algorithmus, der zum Erstellen des Modells verwendet wurde. Dies gilt ebenso für den Datentyp der Spalte. Weitere Informationen finden Sie unter Inhaltsabfragen (Data Mining).
Anforderungen
Bevor Sie eine Abfrage für ein Modell erstellen können, muss das Data Mining-Modell bereits verarbeitet sein. Für die Verarbeitung von SQL Server Analysis Services Objekten sind besondere Berechtigungen erforderlich. Weitere Informationen zur Verarbeitung von Miningmodellen finden Sie unter Verarbeitungsanforderungen und Überlegungen (Data Mining).
Um Abfragen für ein Data Mining-Modell auszuführen, sind je nach Typ der auszuführenden Abfrage unterschiedliche Berechtigungsstufen erforderlich. Zum Beispiel erfordert ein Drillthrough der Fall- oder Strukturdaten in der Regel zusätzliche Berechtigungen, die für das Miningstrukturobjekt oder das Miningmodellobjekt festgelegt werden können.
Wenn die Abfrage jedoch externe Daten verwendet und Anweisungen wie OPENROWSET oder OPENQUERY beinhaltet, müssen diese Anweisungen in der Datenbank, die Sie abfragen, aktiviert werden, und Sie müssen über Berechtigungen für die zugrunde liegenden Datenbankobjekte verfügen.
Weitere Informationen zu den Sicherheitskontexten, die zum Ausführen von Data Mining-Abfragen erforderlich sind, finden Sie unter Sicherheitsübersicht (Data Mining).
In diesem Abschnitt
In den Themen in diesem Abschnitt werden die einzelnen Data Mining-Abfragetypen ausführlicher vorgestellt und Links zu detaillierten Beispielen zum Erstellen von Abfragen für Data Mingin-Modelle bereitgestellt.
Vorhersageabfragen (Data Mining)
Drillthroughabfragen (Data Mining)
Datendefinitionsabfragen (Data Mining)
Related Tasks
Über diese Links erhalten Sie Informationen zum Erstellen und Verwenden von Data Mining-Abfragen.
Weitere Informationen
Data Mining-Algorithmen (Analysis Services - Data Mining)
Miningmodellinhalt (Analysis Services –</ph> Data Mining)