Condividi tramite


SystemGetClusterCrossValidationResults (Analysis Services - Data mining)

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

Partiziona la struttura di data mining nel numero specificato di sezioni incrociate, esegue il training di un modello per ogni partizione, quindi restituisce la metrica di accuratezza per ogni partizione.

Nota Questa stored procedure può essere usata solo con una struttura di data mining contenente almeno un modello di clustering. Per convalidare i modelli non clustering, è necessario usare SystemGetCrossValidationResults (Analysis Services - Data Mining).

Sintassi

  
SystemGetClusterCrossValidationResults(  
<structure name>,   
[,<mining model list>]  
,<fold count>}  
,<max cases>  
<test list>])  

Argomenti

struttura di data mining
Nome di una struttura di data mining nel database corrente.

(obbligatorio)

mining model list
Elenco delimitato da virgole dei modelli di data mining da convalidare.

Se non si specifica un elenco di modelli di data mining, la convalida incrociata viene eseguita su tutti i modelli di clustering associati alla struttura specificata.

Nota

Per convalidare tra i modelli che non sono modelli di clustering, è necessario usare una stored procedure separata, SystemGetCrossValidationResults (Analysis Services - Data Mining).

(facoltativo).

conteggio di riduzione
Valore integer che specifica il numero di partizioni in cui separare il set di dati. Il valore minimo è 2. Il numero massimo di riduzioni è il numero intero massimo o il numero di case, a seconda di quale valore è inferiore.

Ogni partizione conterrà approssimativamente questo numero di casi: numero massimo di casi/di piegatura.

Non è previsto alcun valore predefinito.

Nota

Il numero di riduzioni influisce in modo significativo sul tempo richiesto per l'esecuzione della convalida incrociata. Se si seleziona un numero troppo elevato, l'esecuzione della query potrebbe richiedere molto tempo e in alcuni casi potrebbe verificarsi il blocco o il timeout del server.

(obbligatorio)

numero massimo di case
Valore integer che specifica il numero massimo di case che è possibile sottoporre a test.

Il valore 0 indica che verranno utilizzati tutti i case nell'origine dati.

Se si specifica un numero maggiore del numero effettivo di case presenti nel set di dati, verranno utilizzati tutti i case nell'origine dati.

(obbligatorio)

test list
Stringa che specifica le opzioni di testing.

Nota Questo parametro è riservato per usi futuri.

(facoltativo).

Tipo restituito

La tabella dei tipi restituiti contiene i punteggi per ogni singola partizione e le aggregazioni per tutti i modelli.

Nella tabella seguente vengono descritte le colonne restituite.

Nome colonna Descrizione
ModelName Nome del modello sottoposto a test.
AttributeName Nome della colonna stimabile. Per i modelli del cluster, è sempre null.
AttributeState Valore di destinazione specificato nella colonna stimabile. Per i modelli di cluster, sempre Null.
PartitionIndex Indice in base 1 che identifica la partizione a cui si applicano i risultati.
PartitionSize Valore integer che indica il numero di case inclusi in ogni partizione.
Test Tipo di test eseguito.
Misura Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo del valore stimabile. Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data Mining).

Per un elenco delle misure restituite per ogni tipo stimabile, vedere Misure nel report di convalida incrociata.
Valore Valore della misura di test specificata.

Commenti

Per restituire metriche di accuratezza per l'intero set di dati, usare SystemGetClusterAccuracyResults (Analysis Services - Data Mining).

Inoltre, se il modello di data mining è già stato partizionato in piega, è possibile ignorare l'elaborazione e restituire solo i risultati della convalida incrociata usando SystemGetClusterAccuracyResults (Analysis Services - Data Mining).

Esempio

Nell'esempio seguente viene illustrato come partizionare una struttura di data mining per la convalida incrociata in tre riduzioni, quindi come sottoporre a test due modelli di clustering associati alla struttura di data mining.

Nella terza riga del codice sono specificati i modelli di data mining che si desidera sottoporre a test. Se non si specifica l'elenco, vengono utilizzati tutti i modelli di clustering associati alla struttura.

Nella quarta riga del codice è specificato il numero di riduzioni, mentre nella quinta riga è specificato il numero massimo di case da utilizzare.

Poiché si tratta di modelli di clustering, non è necessario specificare un attributo o un valore stimabile.

CALL SystemGetClusterCrossValidationResults(  
[v Target Mail],  
[Cluster 1], [Cluster 2],  
3,  
10000  
)  

Risultati dell'esempio:

ModelName AttributeName AttributeState PartitionIndex PartitionSize Test Misura Valore
Cluster 1 1 3025 Clustering Probabilità del case 0.930524511864121
Cluster 1 2 3025 Clustering Probabilità del case 0.919184178430778
Cluster 1 3 3024 Clustering Probabilità del case 0.929651120490248
Cluster 2 1 1289 Clustering Probabilità del case 0.922789726933607
Cluster 2 2 1288 Clustering Probabilità del case 0.934865535691068
Cluster 2 3 1288 Clustering Probabilità del case 0.924724595688798

Requisiti

La convalida incrociata è disponibile solo in SQL Server Enterprise a partire da SQL Server 2008.

Vedere anche

SystemGetCrossValidationResults (Analysis Services - Data mining)
SystemGetAccuracyResults (Analysis Services - Data mining)
SystemGetClusterCrossValidationResults
SystemGetClusterAccuracyResults (Analysis Services - Data mining)