SystemGetAccuracyResults (Analysis Services - Data Mining)
Gibt Genauigkeitsmetriken einer Kreuzvalidierung für eine Miningstruktur und alle verwandten Modelle zurück, wobei Clustering-Modelle ausgeschlossen sind.
Diese gespeicherte Prozedur gibt Metriken für das ganze Dataset als einzelne Partition zurück. Um das Dataset in Querschnitte zu partitionieren und Metriken für jede Partition zurückzugeben, verwenden Sie SystemGetCrossValidationResults (Analysis Services – Data Mining).
Hinweis |
---|
Diese gespeicherte Prozedur wird nicht bei Modellen unterstützt, die mithilfe des Microsoft Time Series-Algorithmus oder des Microsoft Sequence Clustering-Algorithmus erstellt werden. Verwenden Sie auch für Clustering-Modelle die separate gespeicherte Prozedur SystemGetClusterAccuracyResults (Analysis Services – Data Mining). |
Syntax
SystemGetAccuracyResults(<mining structure>,
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Argumente
mining structure
Name einer Miningstruktur in der aktuellen Datenbank.(Erforderlich)
model list
Durch Trennzeichen getrennte Liste von Modellen, die überprüft werden sollen.Der Standardwert lautet null. Dies heißt, dass alle anwendbaren Modelle verwendet werden. Bei Verwendung des Standardwerts werden Clustering-Modelle automatisch aus der Liste der Kandidaten für die Verarbeitung ausgeschlossen.
(Optional)
data set
Ein ganzzahliger Wert, der angibt, welche Partition in der Miningstruktur zum Testen verwendet wird. Der Wert wird von einer Bitmaske abgeleitet, die die Summe der folgenden Werte darstellt, wobei jeder einzelne Wert optional ist:Trainingsfälle
0x0001
Testfälle
0x0002
Modellfilter
0x0004
Eine vollständige Liste der möglichen Werte finden Sie in diesem Thema im Abschnitt mit den Hinweisen.
(erforderlich)
target attribute
Zeichenfolge, die den Namen eines vorhersagbaren Objekts enthält. Ein vorhersagbares Objekt kann eine Spalte, eine verschachtelte Tabellenspalte oder eine Schlüsselspalte für eine geschachtelte Tabelle eines Miningmodells sein.(erforderlich)
target state
Zeichenfolge, die einen bestimmten vorherzusagenden Wert enthält.Wenn ein Wert angegeben ist, werden die Metriken für diesen bestimmten Status aufgelistet.
Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.
Der Standardwert lautet null.
(optional)
target threshold
Zahl zwischen 0,0 und 1, die die Mindestwahrscheinlichkeit angibt, mit der Vorhersagewert als richtig gewertet wird.Der Standardwert ist null. Das heißt, dass alle Vorhersagen als richtig gewertet werden.
(optional)
test list
Eine Zeichenfolge, die Testoptionen angibt. Dieser Parameter ist für die zukünftige Verwendung reserviert.(optional)
Rückgabetyp
Das Rowset, das zurückgegeben wird, enthält Bewertungen für jede Partition und Aggregate für alle Modelle.
In der folgenden Tabelle sind die Spalten aufgeführt, die von GetValidationResults zurückgegeben werden.
Spaltenname |
Beschreibung |
---|---|
Modell |
Name des Modells, das getestet wurde. Alles gibt an, dass das Ergebnis ein Aggregat für alle Modelle ist. |
AttributeName |
Der Name der vorhersagbaren Spalte. |
AttributeState |
Ein Zielwert in der vorhersagbaren Spalte. Wenn diese Spalte einen Wert enthält, werden Metriken nur für den angegebenen Status aufgelistet. Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet. |
PartitionIndex |
Bezeichnet die Partition, für die das Ergebnis gilt. Bei dieser Prozedur ist das immer 0. |
PartitionCases |
Ein ganzzahliger Wert, der auf Grundlage des <data set>-Parameters die Anzahl der Zeilen in der Fallmenge angibt. |
Test |
Der Typ von Test, der ausgeführt wurde. |
Measure |
Der Name des Measures, der vom Test zurückgegeben wurde. Measures für die einzelnen Modelle richten sich nach dem Modelltyp und dem Typ des vorhersagbaren Werts. Eine Liste der für die einzelnen vorhersagbaren Typen zurückgegebenen Measures finden Sie unter Bericht für die Kreuzvalidierung (Analysis Services – Data Mining). Eine Definition der einzelnen Measures finden Sie unter Übergreifende Überprüfung (Analysis Services - Data Mining). |
Wert |
Der Wert für das angegebene Measure. |
Hinweise
Die folgende Tabelle enthält Beispiele für die Werte, mit denen Sie die Daten in der für die Kreuzvalidierung verwendeten Miningstruktur angeben können. Wenn Sie Testfälle für die Kreuzvalidierung verwenden möchten, muss die Miningstruktur bereits ein Testdataset enthalten. Informationen zum Definieren eines Testdataset bei der Erstellung einer Miningstruktur finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).
Ganzzahliger Wert |
Beschreibung |
---|---|
1 |
Nur Trainingsfälle werden verwendet. |
2 |
Nur Testfälle werden verwendet. |
3 |
Sowohl die Trainingsfälle als auch Testfälle werden verwendet. |
4 |
Ungültige Kombination. |
5 |
Nur Trainingsfälle werden verwendet, und der Modellfilter wird angewendet. |
6 |
Nur Testfälle werden verwendet, und der Modellfilter wird angewendet. |
7 |
Sowohl die Trainingsfälle als auch Testfälle werden verwendet, und der Modellfilter wird angewendet. |
Weitere Informationen über die Szenarien, in denen Sie Kreuzvalidierung verwenden würden, finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining).
Beispiele
In diesem Beispiel werden Genauigkeitsmeasures für ein einzelnes Entscheidungsstrukturmodell, v Target Mail DT, zurückgegeben, das mit der vTargetMail-Miningstruktur verknüpft ist. Der Code in Zeile 4 gibt an, dass die Ergebnisse auf den Testfällen basieren sollen und für jedes Modell nach dem für das Modell spezifischen Filter gefiltert werden. [Bike Buyer] gibt die Spalte an, die vorhergesagt werden soll, und die 1 in der folgenden Zeile gibt an, dass das Modell nur für den spezifischen Wert 1 bewertet wird, der besagt: "Ja, will kaufen".
Die letzte Zeile des Codes gibt an, dass der Statusschwellenwert 0,5 beträgt. Das heißt, dass Vorhersagen mit einer Wahrscheinlichkeit über 50 Prozent bei der Genauigkeitsberechnung als "gute" Vorhersagen bewertet werden sollen.
CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)
Beispielergebnisse:
ModelName |
AttributeName |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Measure |
Wert |
---|---|---|---|---|---|---|---|
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Klassifizierung |
Wahr positiv |
605 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Klassifizierung |
Falsch positiv |
177 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Klassifizierung |
Wahr negativ |
501 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Klassifizierung |
Falsch negativ |
355 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Wahrscheinlichkeit |
Protokollergebnis |
-0.598454638753028 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Wahrscheinlichkeit |
Prognose |
0.0936717116894395 |
v Target Mail DT |
Bike Buyer |
1 |
0 |
1638 |
Wahrscheinlichkeit |
Wurzel des mittleren Fehlers zum Quadrat |
0.361630800104946 |
Anforderungen
Die Kreuzvalidierung ist nur in SQL Server 2008 Enterprise verfügbar.