Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining)
La scheda Grafico accuratezza modello di data mining, disponibile sia in SQL Server Management Studio sia in Business Intelligence Development Studio, offre diversi strumenti da utilizzare per la convalida di modelli di data mining:
I grafici di accuratezza, i grafici dei profitti e i grafici a dispersione possono essere visualizzati tutti nella scheda Grafico di accuratezza. Utilizzare la scheda Selezione input per scegliere un modello e impostare le opzioni, quindi fare clic sulla scheda Grafico di accuratezza e selezionare il tipo di grafico desiderato nell'elenco Tipo di grafico. Se il modello rappresenta una regressione lineare, verrà automaticamente visualizzato un grafico a dispersione.
Le matrici di classificazione, talvolta denominate tabelle di confusione, possono essere configurate nella scheda Selezione input e quindi visualizzate nella scheda Matrice di classificazione.
I report di convalida incrociata possono essere configurati e visualizzati nella scheda Convalida incrociata della scheda Grafico accuratezza modello di data mining.
[!NOTA]
La scheda Grafico accuratezza modello di data mining non può essere utilizzata con modelli Time Series.
Grafico di accuratezza
Un grafico di accuratezza rappresenta i risultati delle query di stima ricavati da un set di dati di testing rispetto ai valori noti per la colonna stimabile presente nel set di dati. Nel grafico vengono visualizzati i risultati del modello di data mining, insieme a una rappresentazione dei risultati eventualmente prodotti da un modello ideale, e una rappresentazione dei risultati di un'ipotesi casuale. Qualsiasi miglioramento rispetto alla linea dell'ipotesi casuale viene denominato accuratezza. Maggiore è l'accuratezza dimostrata, maggiore sarà l'efficacia del modello. In un grafico di questo tipo è possibile confrontare solo modelli di data mining che contengono attributi stimabili discreti.
È possibile creare un grafico di accuratezza utilizzando la scheda Selezione input per configurare il modello di destinazione e scegliere un set di dati di test. Fare quindi clic sulla scheda Grafico di accuratezza per visualizzare il grafico completato.
Per ulteriori informazioni: Grafico di accuratezza (Analysis Services - Data mining), Procedure per la scheda Grafico accuratezza modello di data mining, Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining)
Grafico dei profitti
Un grafico dei profitti è una variante del grafico di accuratezza che integra informazioni sui costi aziendali tramite l'utilizzo delle stime generate da un modello. Dopo avere immesso le informazioni relative ai costi, ad esempio le spese postali, in Analysis Services viene visualizzata una curva indicante l'accuratezza fornita dal modello e viene calcolato il rendimento dell'investimento ottenuto utilizzato il modello.
È possibile creare un grafico dei profitti utilizzando la scheda Selezione input per configurare il modello di destinazione e scegliere un set di dati di test. Fare quindi clic sulla scheda Grafico di accuratezza e selezionare Grafico profitti nell'elenco Tipo di grafico. Verrà automaticamente visualizzata la finestra di dialogo Impostazioni grafico profitti. Dopo avere configurato parametri univoci per i grafici dei profitti, il grafico visualizzato nella scheda Grafico accuratezza modello di data mining verrà automaticamente modificato per visualizzare i profitti e le perdite per unità.
Per ulteriori informazioni: Grafico profitti (Analysis Services - Data mining), Finestra di dialogo Impostazioni grafico profitti (visualizzazione Grafico accuratezza modello di data mining)
Grafico a dispersione
Un grafico a dispersione rappresenta l'accuratezza di un modello che esegue la stima di un attributo continuo, confrontando i valori effettivi con quelli stimati per ogni case. Ogni volta che agli attributi stimabili sono associati valori continui, viene generato un grafico a dispersione anziché un grafico di accuratezza.
Se il modello supporta colonne di input e la colonna stimabile obbligatoria, è possibile creare un grafico a dispersione nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining. Utilizzare innanzitutto la scheda Selezione input per configurare il modello di destinazione e scegliere un set di dati di test, quindi fare clic sulla scheda Grafico di accuratezza. Il grafico visualizzato nella scheda Grafico accuratezza modello di data mining verrà automaticamente modificato per visualizzare un grafico indicante la relazione lineare tra gli input e i valori stimati.
Per ulteriori informazioni: Grafico a dispersione (Analysis Services - Data mining)
Matrice di classificazione
Una matrice di classificazione è un metodo alternativo per esaminare l'accuratezza delle stime create dai modelli di data mining in una struttura. Per creare una matrice di classificazione, in Analysis Services viene conteggiato il numero di stime affidabili e non affidabili utilizzando i valori effettivi presenti nel set di dati di testing. Tale matrice è uno strumento estremamente utile, in quanto indica non soltanto la frequenza dei valori stimati correttamente dal modello, ma anche i valori stimati in modo errato dal modello. Una matrice di classificazione indica il conteggio effettivo dei valori veri positivi, falsi positivi, veri negativi e falsi negativi per ciascun attributo stimabile.
È possibile creare una matrice di classificazione nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining. Utilizzare innanzitutto la scheda Selezione input per configurare il modello di destinazione e scegliere un set di dati di test, quindi fare clic sulla scheda Matrice di classificazione. Il grafico verrà visualizzato automaticamente, senza che siano necessarie altre operazioni di configurazione.
Per ulteriori informazioni:Matrice di classificazione (Analysis Services - Data mining), Procedure per la scheda Grafico accuratezza modello di data mining, Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining)
Report di convalida incrociata
La convalida incrociata è una tecnica di data mining avanzata che consente di misurare la validità del modello. Quando si crea un report di convalida incrociata, in Analysis Services viene suddiviso il set di dati in più sezioni incrociate e vengono creati e sottoposti a training più modelli nel subset, quindi viene calcolata l'accuratezza per tutti i modelli. Esaminando le statistiche generate, è possibile valutare l'affidabilità della generalizzazione di un modello in set di dati diversi oppure individuare il modello che ha le prestazioni migliori in una struttura.
È possibile creare un report di convalida incrociata nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining selezionando un modello o una struttura, quindi utilizzando la scheda Convalida incrociata per impostare le opzioni relative a numero di riduzioni, attributo di destinazione e così via.
Per ulteriori informazioni: Convalida incrociata (Analysis Services - Data mining), Report Convalida incrociata (Analysis Services - Data mining)