Condividi tramite


Aggiunta di una vista dell'origine dati per i dati del call center (esercitazione intermedia sul data mining)

In questa attività si aggiunge una vista origine dati che verrà usata per accedere ai dati del call center. Gli stessi dati verranno usati per compilare sia il modello di rete neurale iniziale per l'esplorazione che il modello di regressione logistica che verrà usato per fornire raccomandazioni.

Si userà anche Progettazione vista origine dati per aggiungere una colonna per il giorno della settimana. Ciò è dovuto al fatto che, anche se i dati di origine tengono traccia dei dati del call center in base alle date, l'esperienza indica che esistono modelli ricorrenti in termini di volume di chiamate e qualità del servizio, a seconda che il giorno sia un fine settimana o un giorno feriale.

Le procedure

Per aggiungere una vista origine dati

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Viste origine dati e scegliere Nuova vista origine dati.

    Verrà aperta la Creazione guidata vista origine dei dati.

  2. Nella pagina Welcome to the Data Source View Wizard (Visualizzazione guidata origine dati ) fare clic su Avanti.

  3. Nella pagina Selezionare un'origine dati, sotto Origini dati relazionali, selezionare l'origine dati Adventure Works DW Multidimensional 2012. Se questa origine dati non è disponibile, vedere Esercitazione di base sul data mining. Fare clic su Avanti.

  4. Nella pagina Selezione tabelle e viste selezionare la tabella seguente e quindi fare clic sulla freccia destra per aggiungerla alla vista origine dati:

    • FactCallCenter (dbo)

    • DimDate

  5. Fare clic su Avanti.

  6. Nella pagina Completamento procedura guidata , per impostazione predefinita la vista origine dati è denominata Adventure Works DW Multidimensional 2012. Modificare il nome in CallCenter e quindi fare clic su Fine.

    Si apre la finestra Progettazione Vista Origine Dati per mostrare la vista dati CallCenter.

  7. Fare clic con il pulsante destro del mouse all'interno del riquadro Vista origine dati e scegliere Aggiungi/Rimuovi tabelle. Selezionare la tabella DimDate e fare clic su OK.

    Una relazione deve essere aggiunta automaticamente tra le DateKey colonne di ogni tabella. Questa relazione verrà usata per ottenere la colonna EnglishDayNameOfWeek dalla tabella DimDate e usarla nel modello.

  8. Nella finestra di progettazione Vista origine dati fare clic con il pulsante destro del mouse sulla tabella FactCallCenter e scegliere Nuovo calcolo denominato.

    Nella finestra di dialogo Crea calcolo denominato digitare i valori seguenti:

    Nome colonna GiornoDellaSettimana
    Descrizione Ottenere il giorno della settimana dalla tabella DimDate
    Espressione (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Per verificare che l'espressione crei i dati necessari, fare clic con il pulsante destro del mouse sulla tabella FactCallCenter e quindi scegliere Esplora dati.

  9. Esaminare i dati disponibili per comprendere come vengono usati nel data mining:

Nome della colonna Contiene
FactCallCenterID Chiave arbitraria creata quando i dati sono stati importati nel data warehouse.

Questa colonna identifica i record univoci e deve essere utilizzata come chiave del caso per il modello di data mining.
DateKey Data dell'operazione del call center, espressa come numero intero. Le chiavi di data integer vengono spesso usate nei data warehouse, ma è possibile ottenere la data in formato data/ora se si intende raggruppare in base ai valori di data.

Si noti che le date non sono univoche perché il fornitore fornisce un report separato per ogni turno in ogni giorno dell'operazione.
Tipo di Retribuzione Indica se il giorno era un giorno feriale, un fine settimana o una festività.

È possibile che vi sia una differenza di qualità del servizio clienti nei fine settimana e nei giorni feriali, quindi si userà questa colonna come input.
Spostamento Indica il turno per il quale vengono registrate le chiamate. Questo call center divide il giorno lavorativo in quattro turni: AM, PM1, PM2 e Mezzanotte.

È possibile che il cambiamento influisca sulla qualità del servizio clienti in modo da usarlo come input.
LevelOneOperators Indica il numero di operatori di livello 1 in servizio.

I dipendenti del call center iniziano al livello 1 in modo che questi dipendenti siano meno esperti.
LevelTwoOperators Indica il numero di operatori di livello 2 in servizio.

Un dipendente deve registrare un determinato numero di ore di servizio per qualificarsi come operatore di livello 2.
Operatori Totali Numero totale di operatori presenti durante il turno.
Chiamate Numero di chiamate ricevute durante il turno.
AutomaticResponses Numero di chiamate gestite interamente dall'elaborazione automatica delle chiamate (Interactive Voice Response o IVR).
Ordini Il numero di ordini risultanti dalle chiamate.
Problemi generati Il numero di problemi che richiedono un intervento di follow-up generato dalle chiamate.
TempoMedioPerProblema Tempo medio necessario per rispondere a una chiamata in ingresso.
ServiceGrade Metrica che indica la qualità generale del servizio, misurata come tasso di abbandono per l'intero turno. Maggiore è il tasso di abbandono, più è probabile che i clienti siano insoddisfatti e che i potenziali ordini vengano persi.

Si noti che i dati includono quattro colonne diverse basate su una singola colonna di data: WageType, DayOfWeek, Shifte DateKey. In genere, nel data mining non è consigliabile usare più colonne derivate dagli stessi dati, in quanto i valori sono correlati tra loro troppo fortemente e possono nascondere altri modelli.

Tuttavia, non verrà usato DateKey nel modello perché contiene troppi valori univoci. Non esiste alcuna relazione diretta tra Shift e DayOfWeek e WageTypeDayOfWeek sono solo parzialmente correlate. Se si temeva la collinearità, è possibile creare la struttura usando tutte le colonne disponibili e quindi ignorare colonne diverse in ogni modello e testare l'effetto.

Attività successiva nella lezione

Creazione di una struttura e di un modello di rete neurale (esercitazione intermedia sul data mining)

Vedere anche

Viste delle origini dati nei modelli multidimensionali