Esplorazione del modello Call Center (Esercitazione intermedia sul data mining)

Articolo
05/07/2013

Dopo aver compilato il modello esplorativo, è possibile utilizzarlo per ottenere ulteriori informazioni sui dati tramite gli strumenti seguenti disponibili in SQL Server Data Tools (SSDT).

Visualizzatore Microsoft Neural Network**:** questo visualizzatore è disponibile nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining ed è progettato per consentire di provare le interazioni nei dati.
Microsoft Generic Content Tree Viewer**:** questo visualizzatore standard fornisce informazioni dettagliate sui modelli e le statistiche individuati dall'algoritmo durante la generazione del modello.

Visualizzatore Microsoft Neural Network

Questo visualizzatore dispone di tre riquadri: Input, Output e Variabili.

Nel riquadro Output è possibile selezionare valori diversi per l'attributo stimabile o la variabile dipendente. Se il modello contiene più attributi stimabili, è possibile selezionare l'attributo dall'elenco Attributo output.

Nel riquadro Variabili vengono confrontati i due risultati scelti per gli attributi o le variabili. Le barre colorate rappresentano visivamente l'impatto della variabile sui risultati di destinazione. È possibile visualizzare anche punteggi di accuratezza per le variabili. I punteggi di accuratezza vengono calcolati in modo diverso a seconda del tipo di modello di data mining utilizzato, ma indica in generale il miglioramento del modello in caso di utilizzo dell'attributo per la stima.

Il riquadro Input consente di aggiungere fattori di influenza al modello per provare vari scenari di simulazione.

Utilizzo del riquadro Output

In questo modello iniziale interessa vedere come i vari fattori influiscono sul livello del servizio. A questo scopo, è possibile selezionare Service Grade nell'elenco degli attributi di output, quindi confrontare vari livelli di servizio selezionando intervalli diversi negli elenchi a discesa Valore 1 e Valore 2.

Per confrontare i livelli di servizio più basso e più elevato

In Valore 1 selezionare l'intervallo con i valori più bassi. Ad esempio, l'intervallo 0-0-0,7 rappresenta la frequenza di abbandono più bassa e pertanto il migliore livello di servizio.

[!NOTA]

I valori esatti di questo intervallo possono variare a seconda di come è stato configurato il modello.
In Valore 2 selezionare l'intervallo con i valori più elevati. Ad esempio, l'intervallo con il valore >= 0,12 rappresenta la frequenza di abbandono più elevata e pertanto il livello di servizio peggiore. In altre parole, il 12% dei clienti che ha telefonato durante questo turno ha riagganciato prima di parlare con un rappresentante.

Il contenuto del riquadro Variabili viene aggiornato per confrontare gli attributi che contribuiscono ai valori risultanti. Nella colonna sinistra vengono pertanto elencati gli attributi associati al migliore livello di servizio, mentre nella colonna destra vengono elencati gli attributi associati al peggiore livello di servizio.

Utilizzo del riquadro Variabili

In questo modello Average Time Per Issue rappresenta un fattore importante. Questa variabile indica il tempo medio necessario per rispondere a una chiamata, indipendentemente dal tipo di chiamata.

Per visualizzare e copiare i punteggi di probabilità e accuratezza per un attributo

Nel riquadro Variabili posizionare il mouse sulla barra colorata nella prima riga.

Questa barra colorata indica quanto la variabile Average Time Per Issue contribuisca al livello del servizio. La descrizione comando indica un punteggio complessivo e i punteggi di probabilità e accuratezza per ogni combinazione di una variabile e un risultato di destinazione.
Nel riquadro Variabili fare clic con il pulsante destro del mouse su una barra colorata e scegliere Copia.
In un foglio di lavoro di Excel fare clic con il pulsante destro del mouse su una cella qualsiasi e scegliere Incolla.

Il report verrà incollato come tabella HTML e includerà solo i punteggi per ogni barra.
In un foglio di lavoro di Excel diverso fare clic con il pulsante destro del mouse su una cella qualsiasi e scegliere Incolla speciale.

Il report verrà incollato in formato testo e includerà le statistiche correlate descritte nella sezione successiva.

Utilizzo del riquadro Input

Si supponga di essere interessati all'analisi dell'effetto di un particolare fattore, ad esempio il turno o il numero di operatori. È possibile selezionare una determinata variabile tramite il riquadro Input. Il riquadro Variabili verrà aggiornato automaticamente in modo da confrontare i due gruppi selezionati in precedenza in base alla variabile specificata.

Per verificare l'effetto sul livello di servizio modificando gli attributi di input

Nel riquadro Input in Attributo selezionare Shift.
In Valore selezionare AM.

Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello quando il turno è AM. Tutte le altre selezioni rimarranno invariate, in quanto si confrontano ancora i livelli di servizio più basso e più elevato.
Per Valore selezionare PM1.

Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello al variare del turno.
Nel riquadro Input fare clic sulla riga vuota successiva al di sotto di Attributo, quindi selezionare Calls. In Valore selezionare l'intervallo che indica il maggior numero di chiamate.

All'elenco verrà aggiunta una nuova condizione di input. Il riquadro Variabili verrà aggiornato per illustrare l'impatto sul modello per un determinato turno quando il volume di chiamate è massimo.
Continuare a modificare i valori per Shift and Calls per trovare eventuali correlazioni interessanti tra turno, volume di chiamate e livello del servizio.

[!NOTA]

Per cancellare il contenuto del riquadro Input in modo che sia possibile utilizzare altri attributi, fare clic su Aggiorna contenuto visualizzatore.

Interpretazione delle statistiche presenti nel visualizzatore

Tempi di attesa più lunghi rappresentano un importante criterio di stima di una frequenza di abbandono elevata, che indica un livello di servizio insufficiente. Sebbene possa sembrare una conclusione ovvia, il modello di data mining fornisce dati statistici aggiuntivi per l'interpretazione di queste tendenze.

Punteggio: valore che indica l'importanza complessiva della variabile per l'analisi discriminante tra risultati. Più elevato è il punteggio, maggiore sarà l'effetto della variabile sul risultato.
Probabilità di Valore 1: percentuale che rappresenta la probabilità del valore di ottenere il risultato indicato.
Probabilità di Valore 2: percentuale che rappresenta la probabilità del valore di ottenere il risultato indicato.
Accuratezza per Valore 1 e Accuratezza per Valore 2: punteggi che rappresentano l'impatto dell'utilizzo di questa variabile specifica per stimare i risultati di Valore 1 e Valore 2. Più elevato è il punteggio, migliore risulterà la variabile per la stima dei risultati.

La tabella seguente contiene alcuni valori di esempio per i principali fattori di influenza. Ad esempio, Probabilità di Valore 1 è 60,6% e Probabilità di Valore 2 è 8,30%. Per questo motivo, quando Average Time Per Issue è compreso nell'intervallo di 44-70 minuti, il 60,6% dei case sono nel turno con i livelli di servizio più elevati (Valore 1) e l'8,30% nel turno con i livelli di servizio più bassi (Valore 2).

Da queste informazioni è possibile trarre alcune conclusioni. I tempi di risposta alle chiamate più brevi (intervallo 44-70) influiscono decisamente su un livello di servizio migliore (intervallo 0,00-0,07). Il punteggio (92,35) suggerisce che questa variabile è molto importante.

Tuttavia, analizzando l'elenco dei fattori di influenza, è possibile notare altri fattori con effetti più complessi e più difficili da interpretare. Ad esempio, il turno sembra influire sul servizio, ma i punteggi di accuratezza e le probabilità relative indicano che il turno non è un fattore principale.

Average Time Per Issue

89.087 - 120.000

Punteggio: 100

Probabilità di Valore 1: 4,45%

Probabilità di Valore 2: 51,94%

Accuratezza per Valore 1: 0,19

Accuratezza per Valore 2: 1,94

Average Time Per Issue

44.000 - 70.597

Punteggio: 92,35

Probabilità di Valore 1: 60,06%

Probabilità di Valore 2: 8,30%

Accuratezza per Valore 1: 2,61

Accuratezza per Valore 2: 0,31

Torna all'inizio

Microsoft Generic Content Tree Viewer

Questo visualizzatore può essere utilizzato per visualizzare informazioni ancora più dettagliate create dall'algoritmo quando il modello viene elaborato. In Microsoft Generic Content Tree Viewer il modello di data mining viene rappresentato come una serie di nodi, in cui ogni nodo rappresenta le informazioni relative ai dati dell'esercitazione. Questo visualizzatore può essere utilizzato con tutti i modelli, ma il contenuto dei nodi è diverso a seconda del tipo di modello.

Per i modelli di rete neurale o i modelli di regressione logistica, il marginal statistics node può risultare particolarmente utile. Questo nodo contiene statistiche derivate sulla distribuzione di valori nei dati. Queste informazioni possono risultare utili se si desidera ottenere un riepilogo dei dati senza dovere scrivere molte query T-SQL. Il grafico dei valori per la creazione di contenitori nell'argomento precedente deriva dal nodo delle statistiche marginali.

Per ottenere un riepilogo dei valori dei dati dal modello di data mining

In Progettazione modelli di data mining selezionare <nome modello di data mining> nella scheda Visualizzatore modello di data mining.
Dall'elenco Visualizzatore selezionare Microsoft Generic Content Tree Viewer.

La vista del modello di data mining verrà aggiornata per visualizzare una gerarchia di nodi nel riquadro sinistro e una tabella HTML nel riquadro destro.
Nel riquadro Didascalia nodo fare clic sul nodo denominato 10000000000000000.

Il nodo di livello più alto in qualsiasi modello è sempre il nodo radice del modello. In un modello di rete neurale o di regressione logistica il nodo immediatamente successivo è il nodo delle statistiche marginali.
Scorrere il riquadro Dettagli nodo fino alla riga NODE_DISTRIBUTION.
Scorrere la tabella NODE_DISTRIBUTION per visualizzare la distribuzione dei valori calcolati dall'algoritmo Microsoft Neural Network.

Per utilizzare questi dati in un report, è possibile selezionare e copiare le informazioni per le righe specifiche oppure utilizzare la query DMX (Data Mining Extensions) seguente per estrarre il contenuto completo del nodo.

SELECT * 
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'

È inoltre possibile utilizzare la gerarchia di nodi e i dettagli nella tabella NODE_DISTRIBUTION per attraversare singoli percorsi della rete neurale e visualizzare statistiche del livello nascosto. Per ulteriori informazioni, vedere Esempi di query sul modello di rete neurale.

Torna all'inizio

Attività successiva della lezione

Aggiunta di un modello di regressione logistica alla struttura del call center (Esercitazione intermedia sul data mining)

Vedere anche

Condividi tramite