Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wenn Sie eine Abfrage für ein Data Mining-Modell erstellen, können Sie eine Inhaltsabfrage erstellen, die Details zu den mustern bereitstellt, die in der Analyse ermittelt werden, oder eine Vorhersageabfrage, die die Muster im Modell verwendet, um Vorhersagen für neue Daten zu erstellen. Beispielsweise kann eine Inhaltsabfrage für ein neurales Netzwerkmodell Modellmetadaten abrufen, z. B. die Anzahl der ausgeblendeten Ebenen. Alternativ kann eine Vorhersageabfrage Klassifizierungen basierend auf einer Eingabe vorschlagen und optional Wahrscheinlichkeiten für jede Klassifizierung bereitstellen.
In diesem Abschnitt wird erläutert, wie Abfragen für Modelle erstellt werden, die auf dem Microsoft Neural Network-Algorithmus basieren.
Inhaltsabfragen
Abrufen von Modellmetadaten mithilfe von DMX
Abrufen von Modellmetadaten aus dem Schema-Rowset
Abrufen der Eingabeattribute für das Modell
Abrufen von Gewichtungen aus der ausgeblendeten Ebene
Vorhersageabfragen
Erstellen einer Singleton-Vorhersage
Suchen von Informationen zu einem neuralen Netzwerkmodell
Alle Miningmodelle machen den vom Algorithmus gelernten Inhalt gemäß einem standardisierten Schema verfügbar, dem Miningmodellschema-Rowset. Diese Informationen enthalten Details zum Modell und enthalten die grundlegenden Metadaten, strukturen, die in der Analyse ermittelt werden, und Parameter, die bei der Verarbeitung verwendet werden. Sie können Abfragen für den Modellinhalt erstellen, indem Sie Data Mining Extension (DMX)-Anweisungen verwenden.
Beispielabfrage 1: Abrufen von Modellmetadaten mithilfe von XML
Die folgende Abfrage gibt einige grundlegende Metadaten zu einem Modell zurück, das mithilfe des Microsoft Neural Network-Algorithmus erstellt wurde. In einem neuralen Netzwerkmodell enthält der übergeordnete Knoten des Modells nur den Namen des Modells, den Namen der Datenbank, in der das Modell gespeichert ist, und die Anzahl der untergeordneten Knoten. Der Randstatistikknoten (NODE_TYPE = 24) stellt jedoch sowohl diese grundlegenden Metadaten als auch einige abgeleitete Statistiken zu den im Modell verwendeten Eingabespalten bereit.
Die folgende Beispielabfrage basiert auf dem Miningmodell, das Sie im fortgeschrittenen Data-Mining-Tutorial erstellen, mit dem Namen Call Center Default NN. Das Modell verwendet Daten aus einem Callcenter, um mögliche Korrelationen zwischen Personal und Anzahl der Anrufe, Bestellungen und Probleme zu untersuchen. Die DMX-Anweisung ruft Daten aus dem Marginalstatistikknoten des neuronalen Netzwerkmodells ab. Die Abfrage enthält das Schlüsselwort FLATTENED, da die interessanten Eingabeattributenstatistiken in einer geschachtelten Tabelle NODE_DISTRIBUTION gespeichert werden. Wenn Ihr Abfrageanbieter jedoch hierarchische Rowsets unterstützt, müssen Sie das SCHLÜSSELwort FLATTENED nicht verwenden.
SELECT FLATTENED MODEL_CATALOG, MODEL_NAME,
( SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE,
[SUPPORT], [PROBABILITY], VALUETYPE
FROM NODE_DISTRIBUTION
) AS t
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 24
Hinweis
Sie müssen den Namen der geschachtelten Tabellenspalten [SUPPORT] und [PROBABILITY] in eckigen Klammern einschließen, um sie von den reservierten Schlüsselwörtern desselben Namens zu unterscheiden.
Beispielergebnisse:
| MODELL_KATALOG | MODEL_NAME | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.UNTERSTÜTZUNG | t.W'keit | t.VALUETYPE |
|---|---|---|---|---|---|---|
| Adventure Works DW Multidimensional 2012 | Callcenter NN | Durchschnittliche Zeit pro Vorgang | Fehlend | 0 | 0 | 1 |
| Adventure Works DW Multidimensional 2012 | Kundendienstzentrum NN | Durchschnittliche Zeit pro Vorgang | < 64.7094100096 | 11 | 0.407407407 | 5 |
Eine Definition der Bedeutung der Spalten im Schema-Rowset im Kontext eines neuralen Netzwerkmodells finden Sie unter Mining Model Content for Neural Network Models (Analysis Services - Data Mining).For a definition of what the columns in the schema rowset mean in the context of a neural network model, see Mining Model Content for Neural Network Models (Analysis Services - Data Mining).
Beispielabfrage 2: Abrufen von Modellmetadaten aus dem Schema-Rowset
Sie können die gleichen Informationen, die bei einer Inhaltsabfrage des Data-Mining-Schemas zurückgegeben werden, finden, indem Sie das Data-Mining-Schema-Rowset abfragen. Das Schema-Rowset stellt jedoch einige zusätzliche Spalten bereit. Die folgende Beispielabfrage gibt das Datum zurück, an dem das Modell erstellt wurde, das Datum, an dem es geändert wurde, und das Datum, an dem das Modell zuletzt verarbeitet wurde. Die Abfrage gibt auch die vorhersagbaren Spalten zurück, die nicht einfach aus dem Modellinhalt verfügbar sind, und die Parameter, die zum Erstellen des Modells verwendet wurden. Diese Informationen können hilfreich sein, um das Modell zu dokumentieren.
SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Default NN'
Beispielergebnisse:
| MODEL_NAME | Call Center Default NN |
| ERSTELLUNGSDATUM | 1.10.2008 5:07:38 Uhr |
| ZULETZT_BEARBEITET | 1.10.2008 5:24:02 Pm |
| PREDICTION_ENTITY | Durchschnittliche Zeit pro Vorgang Dienstgrad, Anzahl der Bestellungen |
| MINING_PARAMETERS | HOLDOUT_PERCENTAGE=30, HOLDOUT_SEED=0, MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, MAXIMUM_STATES=100, SAMPLE_SIZE=10000, HIDDEN_NODE_RATIO=4 |
Beispielabfrage 3: Abrufen der Eingabeattribute für das Modell
Sie können die Eingabeattribute-Wert-Paare abrufen, die zum Erstellen des Modells verwendet wurden, indem Sie die untergeordneten Knoten (NODE_TYPE = 20) der Eingabeebene (NODE_TYPE = 18) abfragen. Die folgende Abfrage gibt eine Liste der Eingabeattribute aus den Knotenbeschreibungen zurück.
SELECT NODE_DESCRIPTION
FROM [Call Center Default NN].CONTENT
WHERE NODE_TYPE = 2
Beispielergebnisse:
| Knotenbeschreibung |
|---|
| Durchschnittliche Zeit pro Anfrage=64.7094100096 - 77.4002099712 |
| Wochentag=Fr. |
| Operatoren der Ebene 1 |
Hier werden nur einige repräsentative Zeilen aus den Ergebnissen angezeigt. Sie können jedoch sehen, dass die NODE_DESCRIPTION je nach Datentyp des Eingabeattributes geringfügig unterschiedliche Informationen bereitstellt.
Wenn das Attribut ein diskreter oder diskretisierter Wert ist, wird das Attribut und entweder sein Wert oder sein diskretisierter Bereich zurückgegeben.
Wenn das Attribut ein fortlaufender numerischer Datentyp ist, enthält die NODE_DESCRIPTION nur den Attributnamen. Sie können jedoch die geschachtelte NODE_DISTRIBUTION Tabelle abrufen, um den Mittelwert abzurufen, oder die NODE_RULE zurückgeben, um die Mindest- und Höchstwerte des numerischen Bereichs abzurufen.
Die folgende Abfrage zeigt, wie Sie die geschachtelte NODE_DISTRIBUTION Tabelle abfragen, um die Attribute in einer Spalte und deren Werte in einer anderen Spalte zurückzugeben. Bei fortlaufenden Attributen wird der Wert des Attributs durch seinen Mittelwert dargestellt.
SELECT FLATTENED
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 21
Beispielergebnisse:
| t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE |
|---|---|
| Durchschnittliche Zeit pro Vorgang | 64.7094100096 - 77.4002099712 |
| Wochentag | Fr. |
| Operatoren der Ebene 1 | 3,2962962962963 |
Die Werte für den minimalen und maximalen Bereich werden in der spalte NODE_RULE gespeichert und als XML-Fragment dargestellt, wie im folgenden Beispiel gezeigt:
<NormContinuous field="Level 1 Operators">
<LinearNorm orig="2.83967303681711" norm="-1" />
<LinearNorm orig="3.75291955577548" norm="1" />
</NormContinuous>
Beispielabfrage 4: Abrufen von Gewichtungen aus der ausgeblendeten Ebene
Der Modellinhalt eines neuralen Netzwerkmodells ist so strukturiert, dass es einfach ist, Details zu jedem Knoten im Netzwerk abzurufen. Darüber hinaus stellen die ID-Nummern der Knoten Informationen bereit, mit denen Sie Beziehungen zwischen den Knotentypen identifizieren können.
Die folgende Abfrage veranschaulicht, wie die Koeffizienten abgerufen werden, die unter einem bestimmten Knoten der ausgeblendeten Ebene gespeichert sind. Die ausgeblendete Ebene besteht aus einem Organisatorknoten (NODE_TYPE = 19), der nur Metadaten enthält, und mehreren untergeordneten Knoten (NODE_TYPE = 22), die die Koeffizienten für die verschiedenen Kombinationen von Attributen und Werten enthalten. Diese Abfrage gibt nur die Koeffizientenknoten zurück.
SELECT FLATTENED TOP 1 NODE_UNIQUE_NAME,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM [Call Center Default NN -- Predict Service and Orders].CONTENT
WHERE NODE_TYPE = 22
AND [PARENT_UNIQUE_NAME] = '40000000200000000' FROM [Call Center Default NN].CONTENT
Beispielergebnisse:
| NODE_UNIQUE_NAME | t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.WERTETYP |
|---|---|---|---|
| 70000000200000000 | 6000000000000000a | -0.178616518 | 7 |
| 70000000200000000 | 6000000000000000b | -0.267561918 | 7 |
| 70000000200000000 | 6000000000000000c | 0.11069497 | 7 |
| 70000000200000000 | 6000000000000000d | 0.123757712 | 7 |
| 70000000200000000 | 6000000000000000e | 0.294565343 | 7 |
| 70000000200000000 | 6000000000000000f | 0.22245318 | 7 |
| 70000000200000000 | 0.188805045 | 7 |
Die hier gezeigten Teilergebnisse veranschaulichen, wie der Modellinhalt des neuronalen Netzwerks den versteckten Knoten mit den Eingabeknoten in Beziehung setzt.
Die eindeutigen Namen von Knoten in der ausgeblendeten Ebene beginnen immer mit 700000000.
Die eindeutigen Namen von Knoten auf der Eingabeebene beginnen immer mit 600000000.
Daher weisen diese Ergebnisse darauf hin, dass der Knoten, der durch die ID 70000000200000000 gekennzeichnet ist, sechs verschiedene Koeffizienten (VALUETYPE = 7) erhalten hat. Die Werte der Koeffizienten befinden sich in der spalte ATTRIBUTE_VALUE. Mithilfe der Knoten-ID in der Spalte ATTRIBUTE_NAME können Sie genau bestimmen, für welches Eingabeattribute der Koeffizienten bestimmt ist. Beispielsweise bezieht sich die Knoten-ID 6000000000000000a auf Eingabeattribute und -wert, Day of Week = 'Tue.' Sie können die Knoten-ID verwenden, um eine Abfrage zu erstellen, oder Sie können mithilfe der Microsoft Generic Content Tree Viewer zum Knoten navigieren.
Wenn Sie die NODE_DISTRIBUTION Tabelle der Knoten auf der Ausgabeebene abfragen (NODE_TYPE = 23), können Sie die Koeffizienten für jeden Ausgabewert sehen. In der Ausgabeebene verweisen jedoch die Zeiger auf die Knoten der versteckten Schicht. Weitere Informationen finden Sie unter Mining Model Content for Neural Network Models (Analysis Services - Data Mining).
Verwenden eines neuralen Netzwerkmodells zum Erstellen von Vorhersagen
Der Microsoft Neural Network-Algorithmus unterstützt sowohl Klassifizierung als auch Regression. Mit diesen Modellen können Sie Vorhersagefunktionen verwenden, um neue Daten bereitzustellen und entweder Singleton- oder Batchvorhersagen zu erstellen.
Beispielabfrage 5: Erstellen einer Singletonvorhersage
Die einfachste Möglichkeit zum Erstellen einer Vorhersageabfrage für ein neurales Netzwerkmodell besteht darin, den Vorhersageabfrage-Generator zu verwenden, der auf der Registerkarte "Miningvorhersage " von Data Mining Designer sowohl in SQL Server Management Studio als auch in SQL Server Data Tools (SSDT) verfügbar ist. Sie können das Modell im Microsoft Neural Network Viewer durchsuchen, um Attribute von Interesse zu filtern und Trends anzuzeigen, und dann zur Registerkarte "Miningvorhersage " wechseln, um eine Abfrage zu erstellen und neue Werte für diese Trends vorherzusagen.
Sie können z. B. das Callcentermodell durchsuchen, um Korrelationen zwischen den Auftragsvolumen und anderen Attributen anzuzeigen. Öffnen Sie dazu das Modell im Viewer, und wählen Sie für "Eingabe" die Option "Alle>" aus<. Wählen Sie als Nächstes für "Ausgabe" die Option "Anzahl der Bestellungen" aus. Wählen Sie für Wert 1 den Bereich aus, der die meisten Bestellungen darstellt, und wählen Sie für Wert 2 den Bereich aus, der die kleinsten Bestellungen darstellt. Sie können dann auf einen Blick alle Attribute sehen, die das Modell mit dem Auftragsvolumen korreliert.
Indem Sie die Ergebnisse im Viewer durchsuchen, stellen Sie fest, dass bestimmte Wochentage niedrige Bestellmengen aufweisen und dass eine Zunahme der Anzahl der Operatoren mit höheren Verkäufen korreliert wird. Sie könnten dann eine Vorhersageabfrage für das Modell verwenden, um eine "Was wäre"-Hypothese zu testen und zu fragen, ob das Erhöhen der Anzahl von Operatoren der Ebene 2 an einem Tag mit geringem Volumen Bestellungen erhöhen würde. Erstellen Sie dazu eine Abfrage wie die folgenden:
SELECT Predict([Call Center Default NN].[Number of Orders]) AS [Predicted Orders],
PredictProbability([Call Center Default NN].[Number of Orders]) AS [Probability]
FROM [Call Center Default NN]
NATURAL PREDICTION JOIN
(SELECT 'Tue.' AS [Day of Week],
13 AS [Level 2 Operators]) AS t
Beispielergebnisse:
| Vorhergesagte Bestellungen | Wahrscheinlichkeit |
|---|---|
| 364 | 0.9532... |
Das prognostizierte Umsatzvolumen ist höher als der aktuelle Umsatzbereich für Dienstag, und die Wahrscheinlichkeit der Prognose ist sehr hoch. Sie können jedoch mehrere Vorhersagen erstellen, indem Sie einen Batchprozess verwenden, um eine Vielzahl von Hypothesen auf dem Modell zu testen.
Hinweis
Der Data Mining-Add-Ins für Excel 2007 stellt logistische Regressions-Assistenten bereit, mit denen komplexe Fragen leicht beantwortet werden können, z. B. wie viele Operatoren der Ebene 2 erforderlich wären, um die Dienstqualität für eine bestimmte Schicht auf eine Zielebene zu verbessern. Die Data Mining-Add-Ins sind ein kostenloser Download und enthalten Assistenten, die auf dem neuralen Netzwerk und/oder logistischen Regressionsalgorithmen basieren. Weitere Informationen finden Sie auf der Data Mining-Add-Ins für Office 2007-Website .
Liste der Vorhersagefunktionen
Alle Microsoft-Algorithmen unterstützen einen gemeinsamen Satz von Funktionen. Es gibt keine Vorhersagefunktionen, die für den Microsoft Neural Network-Algorithmus spezifisch sind; Der Algorithmus unterstützt jedoch die Funktionen, die in der folgenden Tabelle aufgeführt sind.
| Vorhersagefunktion | Verwendung |
| IsDescendant (DMX) | Bestimmt, ob ein Knoten ein Kindknoten eines anderen Knotens im Graph des neuronalen Netzwerks ist. |
| PredictAdjustedProbability (DMX) | Gibt die gewichtete Wahrscheinlichkeit zurück. |
| PredictHistogram (DMX) | Gibt eine Tabelle mit Werten zurück, die sich auf den aktuellen vorhergesagten Wert beziehen. |
| PredictVariance (DMX) | Gibt die Varianz für den vorhergesagten Wert zurück. |
| PredictProbability (DMX) | Gibt die Wahrscheinlichkeit für den vorhergesagten Wert zurück. |
| PredictStdev (DMX) | Gibt die Standardabweichung für den vorhergesagten Wert zurück. |
| PredictSupport (DMX) | Gibt für neurale Netzwerk- und Logistische Regressionsmodelle einen einzelnen Wert zurück, der die Größe des Trainingssatzes für das gesamte Modell darstellt. |
Informationen zur Syntax bestimmter Funktionen finden Sie unter Data Mining Extensions (DMX) Funktion Referenz.
Siehe auch
Microsoft Neural Network Algorithm
Technische Referenz zum Microsoft Neural Network Algorithm
Inhalt des Miningmodells für neuronale Netzwerkmodelle (Analysis Services - Data Mining)
Lektion 5: Erstellen von neuronalen Netzwerk- und logistischen Regressionsmodellen (Tutorial für fortgeschrittenes Data Mining)