Freigeben über


Hinzufügen einer Datenquellenansicht für Call Center-Daten (Zwischenstufe Data-Mining Tutorial)

In dieser Aufgabe fügen Sie eine Datenquellenansicht hinzu, die für den Zugriff auf die Callcenterdaten verwendet wird. Die gleichen Daten werden verwendet, um sowohl das erste neurale Netzwerkmodell für die Erkundung zu erstellen als auch das logistische Regressionsmodell, das Sie verwenden werden, um Empfehlungen zu erstellen.

Sie verwenden auch den Datenquellenansicht-Designer, um eine Spalte für den Wochentag hinzuzufügen. Das liegt daran, dass, obwohl die Quelldaten die Daten des Callcenters nach Datum verfolgen, Ihre Erfahrung Ihnen zeigt, dass es wiederkehrende Muster sowohl hinsichtlich des Anrufvolumens als auch der Dienstqualität gibt, je nachdem, ob es sich bei dem Tag um ein Wochenende oder einen Wochentag handelt.

Prozeduren

So fügen Sie eine Datenquellenansicht hinzu

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellenansichten, und wählen Sie "Neue Datenquellenansicht" aus.

    Der Datenquellenansichts-Assistent wird geöffnet.

  2. Klicken Sie auf der Seite Willkommen beim Datenquellensicht-Assistenten auf Weiter.

  3. Wählen Sie auf der Seite "Datenquelle auswählen" unter "Relationale Datenquellen" die Datenquelle "Adventure Works DW Multidimensional 2012" aus. Wenn Sie nicht über diese Datenquelle verfügen, lesen Sie das Grundlegende Data Mining-Lernprogramm. Klicke auf Weiter.

  4. Wählen Sie auf der Seite "Tabellen und Ansichten auswählen " die folgende Tabelle aus, und klicken Sie dann auf den Pfeil nach rechts, um sie der Datenquellenansicht hinzuzufügen:

    • FactCallCenter (dbo)

    • DimDate

  5. Klicke auf Weiter.

  6. Auf der Seite "Assistent abschließen " heißt die Datenquellenansicht standardmäßig "Adventure Works DW Multidimensional 2012". Ändern Sie den Namen in CallCenter, und klicken Sie dann auf "Fertig stellen".

    Der Datenquellenansicht-Designer wird geöffnet, um die CallCenter-Datenquellenansicht anzuzeigen.

  7. Klicken Sie mit der rechten Maustaste in den Bereich "Datenquellenansicht", und wählen Sie "Tabellen hinzufügen/entfernen" aus. Wählen Sie die Tabelle aus, dimDate , und klicken Sie auf "OK".

    Eine Beziehung sollte automatisch zwischen den DateKey Spalten in jeder Tabelle hinzugefügt werden. Sie verwenden diese Beziehung, um die Spalte "EnglishDayNameOfWeek" aus der Tabelle "DimDate " abzurufen und in Ihrem Modell zu verwenden.

  8. Klicken Sie im Designer der Datenquellenansicht mit der rechten Maustaste auf die Tabelle , "FactCallCenter", und wählen Sie "Neue benannte Berechnung" aus.

    Geben Sie im Dialogfeld "Benannte Berechnung erstellen " die folgenden Werte ein:

    Spaltenname DayOfWeek
    Beschreibung Wochentag aus der Tabelle "DimDate" abrufen
    Ausdruck (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Um zu überprüfen, ob der Ausdruck die benötigten Daten erstellt, klicken Sie mit der rechten Maustaste auf die Tabelle FactCallCenter, und wählen Sie dann "Daten durchsuchen" aus.

  9. Nehmen Sie sich eine Minute Zeit, um die verfügbaren Daten zu überprüfen, damit Sie verstehen können, wie sie in Data Mining verwendet wird:

Spaltenname Enthält
FactCallCenterID Ein beliebiger Schlüssel, der beim Importieren der Daten in das Data Warehouse erstellt wurde.

Diese Spalte identifiziert eindeutige Datensätze und sollte als Fallschlüssel für das Data Mining-Modell verwendet werden.
Datumschlüssel Das Datum des Callcenter-Vorgangs, ausgedrückt als ganze Zahl. Ganzzahlen-Datumsschlüssel werden häufig in Data Warehouses verwendet, aber Sie können das Datum im Datums-/Uhrzeitformat abrufen, wenn Sie nach Datumswerten gruppieren.

Beachten Sie, dass Datumsangaben nicht eindeutig sind, da der Anbieter einen separaten Bericht für jede Schicht an jedem Tag des Betriebs bereitstellt.
Lohnart Gibt an, ob der Tag ein Wochentag, ein Wochenende oder ein Feiertag war.

Es ist möglich, dass es einen Unterschied in der Qualität des Kundenservices an Wochenenden und Wochentagen gibt, damit Sie diese Spalte als Eingabe verwenden.
Schicht Gibt die Schicht an, für die Anrufe aufgezeichnet werden. Dieses Callcenter teilt den Arbeitstag in vier Schichten auf: AM, PM1, PM2 und Mitternacht.

Es ist möglich, dass die Schicht die Qualität des Kundenservice beeinflusst, sodass Sie dies als Eingabe verwenden werden.
LevelOneOperators Gibt die Anzahl der Einsatzkräfte auf Level 1 an.

Mitarbeiter des Callcenters beginnen auf Ebene 1, sodass diese Mitarbeiter weniger erfahren sind.
LevelTwoOperators Gibt die Anzahl der Mitarbeiter auf Level 2 im Dienst an.

Ein Mitarbeiter muss eine bestimmte Anzahl von Servicestunden protokollieren, um als Operator der Ebene 2 zu gelten.
TotalOperators Die Gesamtzahl der Operatoren, die während der Schicht vorhanden sind.
Anrufe Die Anzahl der Anrufe, die während der Schicht empfangen wurden.
AutomaticResponses Die Anzahl der Anrufe, die vollständig von der automatisierten Anrufverarbeitung (Interactive Voice Response oder IVR) verarbeitet wurden.
Aufträge Die Anzahl der Bestellungen, die aus Anrufen resultierten.
Aufgeworfene Probleme Die Anzahl der Probleme, die eine Nachverfolgung erfordern, die von Anrufen generiert wurden.
Durchschnittliche Zeit pro Vorgang Die durchschnittliche Zeit, die zum Beantworten eines eingehenden Anrufs erforderlich ist.
ServiceGrade Eine Metrik, die die allgemeine Dienstqualität angibt, gemessen als Abbruchrate für die gesamte Schicht. Je höher die Abbruchrate ist, desto wahrscheinlicher ist es, dass Kunden unzufrieden sind und dass potenzielle Aufträge verloren gehen.

Beachten Sie, dass die Daten vier verschiedene Spalten enthalten, die auf einer einzelnen Datumsspalte basieren: WageType, DayOfWeek, Shiftund DateKey. Im Data Mining empfiehlt es sich in der Regel nicht, mehrere Spalten zu verwenden, die von denselben Daten abgeleitet werden, da die Werte zu stark miteinander korrelieren und andere Muster verdecken können.

Im Modell wird jedoch nicht verwendet DateKey , da es zu viele eindeutige Werte enthält. Es gibt keine direkte Beziehung zwischen ShiftUnd DayOfWeek, und WageTypeDayOfWeek sind nur teilweise miteinander verbunden. Wenn Sie sich Sorgen um Die Kollinearität gemacht haben, könnten Sie die Struktur mit allen verfügbaren Spalten erstellen und dann unterschiedliche Spalten in jedem Modell ignorieren und den Effekt testen.

Nächste Aufgabe in der Lektion

Erstellen einer neuronalen Netzwerkstruktur und eines neuronalen Modells (Tutorial für fortgeschrittene Datenanalyse)

Siehe auch

Datenquellenansichten in mehrdimensionalen Modellen