Grafico lift
La scheda Grafico lift nella scheda Grafico accuratezza modello di data mining di Progettazione modelli di data mining consente di visualizzare due tipi di grafici: un grafico lift e un grafico dei profitti. Un grafico lift confronta l'accuratezza delle stime di ogni modello, mentre un grafico dei profitti visualizza l'aumento teorico dei profitti associato all'utilizzo di ogni modello.
Per selezionare il tipo di grafico desiderato, utilizzare l'elenco Tipo di grafico. Quando si seleziona Grafico profitti dall'elenco, verrà aperta automaticamente la finestra di dialogo Impostazioni grafico profitti. Tale finestra di dialogo viene aperta inoltre quando si fa clic su Impostazioni. È possibile utilizzare questa finestra di dialogo per impostare i parametri che definiscono il grafico dei profitti.
Un grafico dei profitti consente di confrontare solo i modelli di data mining che contengono attributi stimabili discreti. Non è possibile utilizzare la scheda Grafico accuratezza modello di data mining con i modelli Time Series o con i modelli che includono attributi stimabili continui.
Per ulteriori informazioni:Procedure per la scheda Grafico accuratezza modello di data mining, Mapping delle colonne (grafico lift), Convalida dei modelli di data mining
Tipi di grafico
Nelle sezioni seguenti è disponibile una descrizione più dettagliata di ogni tipo di grafico:
- Tipo di grafico lift
- Tipo di grafico dei profitti
Tipo di grafico lift
Nella scheda Grafico lift viene visualizzata una rappresentazione grafica della variazione di un lift causata dal modello di data mining. Si consideri ad esempio il caso in cui il reparto Marketing dell'azienda Adventure Works Cycles intenda creare una campagna di mailing diretto. Dalle campagne precedenti è stato ricavato che la percentuale di risposta tipica è pari al 10%. In una tabella del database è archiviato un elenco di 10.000 potenziali clienti. In base alla percentuale di risposta tipica, è possibile prevedere che risponderanno 1.000 clienti.
Si consideri inoltre che il budget del progetto è inferiore all'importo di spesa necessario per raggiungere tutti i 10.000 clienti archiviati nel database. Il budget consente di inviare un annuncio pubblicitario solo a 5.000 clienti. Il reparto Marketing può scegliere tra due alternative:
- Selezionare come destinatari 5.000 clienti in modo casuale
- Utilizzare un modello di data mining per selezionare come destinatari i 5.000 clienti che con maggiore probabilità risponderanno
Se l'azienda seleziona in modo casuale 5.000 clienti, è possibile prevedere che verranno raggiunti solo 500 dei 1.000 clienti per i quali è stata stimata una risposta positiva, in quanto generalmente risponde solo il 10% dei destinatari. Questo scenario è rappresentato dalla linea dell'ipotesi casuale del grafico lift. Se invece il reparto Marketing utilizza un modello di data mining per selezionare i destinatari del mailing, è possibile prevedere una percentuale di risposta superiore in quanto è possibile scegliere come destinatari i clienti che con maggiore probabilità risponderanno. Se il modello è perfetto, ovvero consente di creare stime che non sono mai errate, l'azienda può prevedere che verranno raggiunti tutti i 1.000 clienti per i quali è stata stimata una risposta inviando il mailing ai 1.000 potenziali clienti indicati dal modello. Questo scenario è rappresentato dalla linea del modello ideale del grafico lift. In realtà, è più probabile che il modello di data mining sia compreso tra i due estremi, ovvero tra l'ipotesi casuale e una stima ideale o perfetta. Qualsiasi miglioramento nella risposta derivante dall'ipotesi casuale viene considerato un lift.
È possibile creare due tipi di grafico, uno in cui si specifica uno stato della colonna stimabile e l'altro in cui non si specifica lo stato.
Se si specifica lo stato della colonna stimabile, viene creato il tipo di grafico illustrato nel diagramma seguente.
L'asse X del grafico rappresenta la percentuale del set di dati di prova utilizzata per confrontare le stime. L'asse Y del grafico rappresenta la percentuale di valori stimati corrispondenti allo stato specificato. Nel grafico, la linea rossa rappresenta la linea dell'ipotesi casuale e la linea gialla rappresenta il modello ideale.
Se non si specifica lo stato della colonna stimabile, viene creato il tipo di grafico illustrato nel diagramma seguente.
L'asse X è lo stesso del grafico con la colonna stimabile specificata, ma in questo caso l'asse Y rappresenta la percentuale di stime corrette. In questo grafico, la linea rossa rappresenta il modello ideale.
Quando si passa dalla scheda Mapping colonne alla scheda Grafico lift e viceversa, il grafico viene aggiornato per riflettere le modifiche apportate nei mapping delle colonne.
Torna all'inizio
Tipo di grafico dei profitti
Un grafico dei profitti consente di visualizzare l'aumento dei profitti stimati associato all'utilizzo del modello di data mining al fine di determinare i clienti che devono essere contattati in uno scenario aziendale. L'asse Y del grafico rappresenta i profitti, mentre l'asse X rappresenta la percentuale della popolazione contattata dall'azienda. Un grafico dei profitti tipico mostra un incremento dei profitti fino a un punto specifico, dopo il quale i profitti diminuiscono con l'aumentare della popolazione contattata.
Per visualizzare il grafico dei profitti, utilizzare l'elenco Tipo di grafico. Dopo aver selezionato Grafico profitti, verrà aperta la finestra di dialogo Impostazioni grafico profitti. Tale finestra di dialogo consente di impostare i parametri che definiscono il grafico dei profitti. Nell'elenco seguente vengono descritti i parametri che è possibile impostare.
- Popolazione
Numero di case nel set di dati utilizzato per la creazione del grafico lift, ad esempio il numero di potenziali clienti.
- Costi fissi
Costi fissi associati al problema aziendale. Nel caso di una soluzione per il mailing diretto, i costi non dipendono da variabili quali il numero di chiamate telefoniche effettuate o il numero di mailing promozionali inviati.
- Costi singolo contatto
Costi extra in aggiunta ai costi fissi che possono essere associati al contatto di ogni cliente, relativi ad esempio a mailing promozionali o a chiamate telefoniche.
- Ricavi per singolo contatto
Importo dei ricavi associati a ogni vendita effettuata.
È inoltre possibile aprire la finestra di dialogo Impostazioni grafico profitti facendo clic su Impostazioni nella scheda Grafico lift.
Il grafico dei profitti contiene una linea verticale grigia, che è possibile spostare facendo clic su un punto del grafico. La Legenda data mining consente di visualizzare un punteggio, la popolazione corretta e la probabilità di stima associata alla posizione della linea grigia nel grafico. Se si seleziona il punto massimo di profitti nel grafico tramite la linea grigia, è possibile utilizzare il valore della probabilità di stima al fine di determinare una soglia di probabilità per contattare un cliente.
Se ad esempio il picco della curva dei profitti corrisponde al 55% della popolazione e la probabilità di stima associata è pari al 20%, per raggiungere i profitti massimi è consigliabile contattare solo i clienti la cui risposta viene stimata con una probabilità del 20% o superiore.
Torna all'inizio
Vedere anche
Concetti
Mapping delle colonne (grafico lift)
Concetti di base sul data mining
Utilizzo del data mining
Convalida dei modelli di data mining
Altre risorse
Procedure per la scheda Grafico accuratezza modello di data mining