Test dell'accuratezza con i grafici di accuratezza (Esercitazione di base sul data mining)
Nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining è possibile calcolare il grado di accuratezza delle stime eseguite dai modelli e si possono confrontare i risultati di ogni modello con quelli degli altri. Questo metodo comparativo è noto come grafico di accuratezza. In genere, l'accuratezza predittiva di un modello di data mining è misurata dall'accuratezza stessa del modello o dall'accuratezza della classificazione. Per questa esercitazione si utilizzerà solo il grafico di accuratezza. Per ulteriori informazioni sull'utilizzo dei grafici di accuratezza e di altro tipo, vedere Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining).
In questo argomento verranno eseguite le attività seguenti:
Scelta dei dati di input
Selezione di modelli, colonne stimabili e valori
Scelta dei dati di input
Il primo passaggio per verificare l'accuratezza dei modelli di data mining consiste nel selezionare l'origine dati che verrà utilizzata per il testing. Si testerà l'accuratezza dei modelli rispetto ai dati di testing, quindi li si utilizzerà con dati esterni.
Per selezionare il set di dati
In SQL Server Data Tools (SSDT) passare alla scheda Grafico di accuratezza modello di data mining di Progettazione modelli di data mining e selezionare la scheda Selezione input.
Nella casella di gruppo Seleziona set di dati da utilizzare per il grafico di accuratezza selezionare Utilizza test case della struttura di data mining per testare i modelli tramite i dati di testing riservati quando è stata creata la struttura di data mining.
Per ulteriori informazioni sulle altre opzioni, vedere Scegliere un tipo di grafico di accuratezza e impostare le opzioni del grafico.
Selezione di modelli, colonne stimabili e valori
Il passaggio successivo consiste nel selezionare i modelli che si desidera includere nel grafico di accuratezza, le colonne stimabili con le quali confrontare i modelli e il valore da stimare.
[!NOTA]
Le colonne del modello di data mining nell'elenco Nome colonna stimabile sono limitate alle colonne che hanno il tipo di utilizzo impostato su Predict o Predict Only e il tipo di contenuto Discrete o Discretized.
Per visualizzare l'accuratezza dei modelli
Nella scheda Selezione input di Progettazione modelli di data mining, in Selezionare le colonne stimabili del modello di data mining da visualizzare nel grafico di accuratezza, selezionare la casella di controllo Sincronizza colonne e valori di stima.
Nella colonna Nome colonna stimabile verificare che Bike Buyer sia selezionato per ogni modello.
Nella colonna Mostra selezionare ciascun modello.
Per impostazione predefinita, nella struttura di data mining sono selezionati tutti i modelli. È possibile decidere di non includere un modello. Tuttavia in questa esercitazione verranno lasciati selezionati tutti i modelli.
Nella colonna Valore stima selezionare 1. Lo stesso valore viene inserito automaticamente per ciascun modello che ha la stessa colonna stimabile.
Selezionare la scheda Grafico di accuratezza per visualizzare il grafico di accuratezza.
Quando si fa clic sulla scheda, viene eseguita una query di stima sul server e sul database per la struttura di data mining e la tabella di input o i dati di test. I risultati vengono tracciati sul grafico.
Quando si immette un Valore stima, il grafico di accuratezza traccia un modello di ipotesi casuale e un modello ideale. Il modello di data mining creato sarà compreso tra questi due estremi, ovvero tra l'ipotesi casuale e una stima perfetta. Qualsiasi miglioramento dell'ipotesi casuale viene considerato un livello di accuratezza.
Utilizzare la legenda per individuare le linee colorate che rappresentano il modello ideale e il modello di ipotesi casuale.
Si noterà che il modello TM_Decision_Tree fornisce il maggiore livello di accuratezza, superando sia il modello Clustering che quello Naive Bayes.
Per una spiegazione dettagliata di un grafico di accuratezza simile a quello creato in questa lezione, vedere Grafico di accuratezza (Analysis Services - Data mining).
Attività successiva della lezione
Test di un modello filtrato (Esercitazione di base sul data mining)
Vedere anche
Riferimento
Scheda Grafico di accuratezza (vista Grafico di accuratezza modello di data mining)