Artikel
09/24/2010

SystemGetAccuracyResults (Analysis Services - Data Mining)

Gibt Genauigkeitsmetriken einer Kreuzvalidierung für eine Miningstruktur und alle verwandten Modelle zurück, wobei Clustering-Modelle ausgeschlossen sind.

Diese gespeicherte Prozedur gibt Metriken für das ganze Dataset als einzelne Partition zurück. Um das Dataset in Querschnitte zu partitionieren und Metriken für jede Partition zurückzugeben, verwenden Sie SystemGetCrossValidationResults (Analysis Services – Data Mining).

Hinweis
Diese gespeicherte Prozedur wird nicht bei Modellen unterstützt, die mithilfe des Microsoft Time Series-Algorithmus oder des Microsoft Sequence Clustering-Algorithmus erstellt werden. Verwenden Sie auch für Clustering-Modelle die separate gespeicherte Prozedur SystemGetClusterAccuracyResults (Analysis Services – Data Mining).

Syntax

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumente

mining structure
Name einer Miningstruktur in der aktuellen Datenbank.

(Erforderlich)
model list
Durch Trennzeichen getrennte Liste von Modellen, die überprüft werden sollen.

Der Standardwert lautet null. Dies heißt, dass alle anwendbaren Modelle verwendet werden. Bei Verwendung des Standardwerts werden Clustering-Modelle automatisch aus der Liste der Kandidaten für die Verarbeitung ausgeschlossen.

(Optional)
data set
Ein ganzzahliger Wert, der angibt, welche Partition in der Miningstruktur zum Testen verwendet wird. Der Wert wird von einer Bitmaske abgeleitet, die die Summe der folgenden Werte darstellt, wobei jeder einzelne Wert optional ist:

Trainingsfälle

0x0001

Testfälle

0x0002

Modellfilter

0x0004

Eine vollständige Liste der möglichen Werte finden Sie in diesem Thema im Abschnitt mit den Hinweisen.

(erforderlich)
target attribute
Zeichenfolge, die den Namen eines vorhersagbaren Objekts enthält. Ein vorhersagbares Objekt kann eine Spalte, eine verschachtelte Tabellenspalte oder eine Schlüsselspalte für eine geschachtelte Tabelle eines Miningmodells sein.

(erforderlich)
target state
Zeichenfolge, die einen bestimmten vorherzusagenden Wert enthält.

Wenn ein Wert angegeben ist, werden die Metriken für diesen bestimmten Status aufgelistet.

Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.

Der Standardwert lautet null.

(optional)
target threshold
Zahl zwischen 0,0 und 1, die die Mindestwahrscheinlichkeit angibt, mit der Vorhersagewert als richtig gewertet wird.

Der Standardwert ist null. Das heißt, dass alle Vorhersagen als richtig gewertet werden.

(optional)
test list
Eine Zeichenfolge, die Testoptionen angibt. Dieser Parameter ist für die zukünftige Verwendung reserviert.

(optional)

Rückgabetyp

Das Rowset, das zurückgegeben wird, enthält Bewertungen für jede Partition und Aggregate für alle Modelle.

In der folgenden Tabelle sind die Spalten aufgeführt, die von GetValidationResults zurückgegeben werden.

Spaltenname	Beschreibung
Modell	Name des Modells, das getestet wurde. Alles gibt an, dass das Ergebnis ein Aggregat für alle Modelle ist.
AttributeName	Der Name der vorhersagbaren Spalte.
AttributeState	Ein Zielwert in der vorhersagbaren Spalte. Wenn diese Spalte einen Wert enthält, werden Metriken nur für den angegebenen Status aufgelistet. Wenn kein Wert oder Null angegeben ist, werden die Metriken für den wahrscheinlichsten Status der einzelnen Vorhersagen berechnet.
PartitionIndex	Bezeichnet die Partition, für die das Ergebnis gilt. Bei dieser Prozedur ist das immer 0.
PartitionCases	Ein ganzzahliger Wert, der auf Grundlage des <data set>-Parameters die Anzahl der Zeilen in der Fallmenge angibt.
Test	Der Typ von Test, der ausgeführt wurde.
Measure	Der Name des Measures, der vom Test zurückgegeben wurde. Measures für die einzelnen Modelle richten sich nach dem Modelltyp und dem Typ des vorhersagbaren Werts. Eine Liste der für die einzelnen vorhersagbaren Typen zurückgegebenen Measures finden Sie unter Bericht für die Kreuzvalidierung (Analysis Services – Data Mining). Eine Definition der einzelnen Measures finden Sie unter Übergreifende Überprüfung (Analysis Services - Data Mining).
Wert	Der Wert für das angegebene Measure.

Hinweise

Die folgende Tabelle enthält Beispiele für die Werte, mit denen Sie die Daten in der für die Kreuzvalidierung verwendeten Miningstruktur angeben können. Wenn Sie Testfälle für die Kreuzvalidierung verwenden möchten, muss die Miningstruktur bereits ein Testdataset enthalten. Informationen zum Definieren eines Testdataset bei der Erstellung einer Miningstruktur finden Sie unter Partitionieren von Daten in Trainings- und Testsätze (Analysis Services - Data Mining).

Ganzzahliger Wert	Beschreibung
1	Nur Trainingsfälle werden verwendet.
2	Nur Testfälle werden verwendet.
3	Sowohl die Trainingsfälle als auch Testfälle werden verwendet.
4	Ungültige Kombination.
5	Nur Trainingsfälle werden verwendet, und der Modellfilter wird angewendet.
6	Nur Testfälle werden verwendet, und der Modellfilter wird angewendet.
7	Sowohl die Trainingsfälle als auch Testfälle werden verwendet, und der Modellfilter wird angewendet.

Weitere Informationen über die Szenarien, in denen Sie Kreuzvalidierung verwenden würden, finden Sie unter Überprüfen von Data Mining-Modellen (Analysis Services - Data Mining).

Beispiele

In diesem Beispiel werden Genauigkeitsmeasures für ein einzelnes Entscheidungsstrukturmodell, v Target Mail DT, zurückgegeben, das mit der vTargetMail-Miningstruktur verknüpft ist. Der Code in Zeile 4 gibt an, dass die Ergebnisse auf den Testfällen basieren sollen und für jedes Modell nach dem für das Modell spezifischen Filter gefiltert werden. [Bike Buyer] gibt die Spalte an, die vorhergesagt werden soll, und die 1 in der folgenden Zeile gibt an, dass das Modell nur für den spezifischen Wert 1 bewertet wird, der besagt: "Ja, will kaufen".

Die letzte Zeile des Codes gibt an, dass der Statusschwellenwert 0,5 beträgt. Das heißt, dass Vorhersagen mit einer Wahrscheinlichkeit über 50 Prozent bei der Genauigkeitsberechnung als "gute" Vorhersagen bewertet werden sollen.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Beispielergebnisse:

ModelName	AttributeName	AttributeState	PartitionSize	Test	Measure	Wert
v Target Mail DT	Bike Buyer	1	1638	Klassifizierung	Wahr positiv	605
v Target Mail DT	Bike Buyer	1	1638	Klassifizierung	Falsch positiv	177
v Target Mail DT	Bike Buyer	1	1638	Klassifizierung	Wahr negativ	501
v Target Mail DT	Bike Buyer	1	1638	Klassifizierung	Falsch negativ	355
v Target Mail DT	Bike Buyer	1	1638	Wahrscheinlichkeit	Protokollergebnis	-0.598454638753028
v Target Mail DT	Bike Buyer	1	1638	Wahrscheinlichkeit	Prognose	0.0936717116894395
v Target Mail DT	Bike Buyer	1	1638	Wahrscheinlichkeit	Wurzel des mittleren Fehlers zum Quadrat	0.361630800104946