Articolo
03/31/2012

SystemGetAccuracyResults (Analysis Services - Data mining)

Restituisce la metrica di accuratezza per la convalida incrociata di una struttura di data mining e di tutti i modelli correlati, tranne i modelli di clustering.

Questa stored procedure restituisce la metrica per l'intero set di dati come un'unica partizione. Per partizionare il set di dati in sezioni incrociate e restituire la metrica per ogni partizione, utilizzare SystemGetCrossValidationResults (Analysis Services - Data mining).

Nota

Questa stored procedure non è supportata per i modelli compilati mediante l'algoritmo Microsoft Time Series o Microsoft Sequence Clustering. Per i modelli di clustering, utilizzare inoltre la stored procedure specifica, ovvero SystemGetClusterAccuracyResults (Analysis Services - Data mining).

Sintassi

SystemGetAccuracyResults(<mining structure>, 
[,<mining model list>]
,<data set>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argomenti

mining structure
Nome di una struttura di data mining nel database corrente.

(Obbligatorio)
model list
Elenco delimitato da virgole dei modelli da convalidare.

Il valore predefinito è null. In questo modo vengono utilizzati tutti i modelli applicabili. Se si utilizza l'impostazione predefinita, i modelli di clustering vengono esclusi automaticamente dall'elenco di candidati per l'elaborazione.

(Facoltativo)
data set
Valore integer che indica quale partizione nella struttura di data mining viene utilizzato per il test. Il valore è derivato da una maschera di bit che rappresenta la somma dei valori seguenti, dove qualsiasi singolo valore è facoltativo:

Case di training

0x0001

Test case

0x0002

Filtro modello

0x0004

Per un elenco completo dei valori possibili, vedere la sezione Osservazioni di questo argomento.

(obbligatorio)
target attribute
Stringa che contiene il nome di un oggetto stimabile. Un oggetto stimabile può essere una colonna, una colonna della tabella nidificata o una colonna chiave della tabella nidificata di un modello di data mining.

(obbligatorio)
target state
Stringa che contiene un valore specifico da stimare.

Se si specifica un valore, viene raccolta la metrica per tale stato specifico.

Se non si specifica alcun valore oppure si specifica un valore null, viene calcolata la metrica per lo stato più probabile per ogni stima.

Il valore predefinito è null.

(facoltativo)
target threshold
Numero compreso tra 0.0 e 1 che specifica la probabilità minima entro cui il valore della stima viene conteggiato come corretto.

Il valore predefinito è null, ovvero tutte le stime vengono conteggiate come corrette.

(facoltativo)
test list
Stringa che specifica le opzioni di testing. Questo parametro è riservato per utilizzi futuri.

(facoltativo)

Tipo restituito

Il set di righe restituito contiene punteggi per ogni partizione e aggregazioni per tutti i modelli.

Nella tabella seguente vengono elencate le colonne restituite da GetValidationResults.

Nome della colonna	Descrizione
Modello	Nome del modello sottoposto a test. Tutti indica che il risultato è un'aggregazione per tutti i modelli.
AttributeName	Nome della colonna stimabile.
AttributeState	Valore di destinazione nella colonna stimabile. Se questa colonna contiene un valore, la metrica viene raccolta solo per lo stato specifico. Se questo valore non è specificato oppure è null, viene calcolata la metrica per lo stato più probabile per ogni stima.
PartitionIndex	Indica la partizione a cui si applica il risultato. Per questa procedura, è sempre 0.
PartitionCases	Valore integer che indica il numero di righe nel case set, in base al parametro <data set>.
Test	Tipo di test eseguito.
Measure	Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo di modello e dal tipo del valore stimabile. Per un elenco delle misure restituite per ogni tipo stimabile, vedere Report Convalida incrociata (Analysis Services - Data mining). Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data mining).
Value	Valore per la misura specificata.

Osservazioni

Nella tabella seguente vengono forniti esempi dei valori che è possibile utilizzare per specificare i dati nella struttura di data mining utilizzata per la convalida incrociata. Se si desidera utilizzare test case per la convalida incrociata, è necessario che la struttura di data mining contenga già un set di dati di testing. Per informazioni sulla definizione di un set di dati di testing quando si crea una struttura di data mining, vedere Partizionamento dei dati in set di training e in set di testing (Analysis Services - Data mining).

Valore integer	Descrizione
1	Vengono utilizzati solo i case di training.
2	Vengono utilizzati solo i test case.
3	Vengono utilizzati sia i case di training sia i test case.
4	Combinazione non valida.
5	Vengono utilizzati i case di training e viene applicato il filtro del modello.
6	Vengono utilizzati solo i test case e viene applicato il filtro del modello.
7	Vengono utilizzati sia i case di training sia i test case e viene applicato il filtro del modello.

Per ulteriori informazioni sugli scenari in cui è possibile utilizzare la convalida incrociata, vedere Convalida di modelli di data mining (Analysis Services - Data mining).

Esempi

In questo esempio vengono restituite le misure di accuratezza per un singolo modello di albero delle decisioni, ovvero v Target Mail DT, associato alla struttura di data mining vTargetMail. Il codice nella quarta riga indica che i risultati devono essere basati sui test case, filtrati per ogni modello dal filtro specifico applicato a tale modello. [Bike Buyer] specifica la colonna che deve essere stimata e il numero 1 nella riga successiva indica che il modello deve essere valutato solo per il valore 1 specifico, indicando che l'acquisto verrà effettuato.

L'ultima riga del codice specifica che il valore soglia di stato corrisponde a 0.5. Ciò significa che le stime con una probabilità maggiore del 50 percento devono essere conteggiate come stime affidabili durante il calcolo dell'accuratezza.

CALL SystemGetAccuracyResults (
[vTargetMail],
[vTargetMail DT],
6,
'Bike Buyer',
1,
0.5
)

Risultati dell'esempio:

ModelName	AttributeName	AttributeState	PartitionSize	Test	Measure	Value
v Target Mail DT	Bike Buyer	1	1638	Classificazione	Vero positivo	605
v Target Mail DT	Bike Buyer	1	1638	Classificazione	Falso positivo	177
v Target Mail DT	Bike Buyer	1	1638	Classificazione	Vero negativo	501
v Target Mail DT	Bike Buyer	1	1638	Classificazione	Falso negativo	355
v Target Mail DT	Bike Buyer	1	1638	Probabilità	Punteggio in forma logaritmica	-0.598454638753028
v Target Mail DT	Bike Buyer	1	1638	Probabilità	Accuratezza	0.0936717116894395
v Target Mail DT	Bike Buyer	1	1638	Probabilità	Radice errore quadratico medio	0.361630800104946