Freigeben über


Prüfen des Callcentermodells (Data Mining-Lernprogramm für Fortgeschrittene)

Nachdem Sie nun das explorative Modell erstellt haben, können Sie es verwenden, um mehr über Ihre Daten zu erfahren, indem Sie die folgenden Tools verwenden, die in SQL Server Data Tools (SSDT) bereitgestellt werden.

  • Microsoft Neural Network Viewer: Dieser Viewer ist auf der Registerkarte "Mining Model Viewer" des Data Mining-Designers verfügbar und soll Ihnen helfen, mit Interaktionen in den Daten zu experimentieren.

  • Microsoft Generic Content Tree Viewer: Dieser Standard-Viewerenthält ausführliche Details zu den Mustern und Statistiken, die beim Generieren des Modells vom Algorithmus ermittelt wurden.

Microsoft-Viewer für neuronale Netzwerke

Der Viewer verfügt über drei Bereiche : Eingabe, Ausgabe und Variablen.

Mithilfe des Ausgabebereichs können Sie unterschiedliche Werte für das vorhersagbare Attribut oder abhängige Variable auswählen. Wenn Ihr Modell mehrere vorhersagbare Attribute enthält, können Sie das Attribut aus der Ausgabeattributeliste auswählen.

Im Bereich "Variablen " werden die beiden Ergebnisse verglichen, die Sie in Bezug auf beitragende Attribute oder Variablen ausgewählt haben. Die farbigen Leisten stellen visuell dar, wie stark sich die Variable auf die Zielergebnisse auswirkt. Sie können auch Liftergebnisse für die Variablen anzeigen. Ein Liftergebnis wird abhängig vom verwendeten Miningmodelltyp unterschiedlich berechnet, gibt jedoch i. d. R. Aufschluss über die Verbesserung im Modell, die beim Verwenden dieses Attributs für die Vorhersage erreicht wird.

Im Eingabebereich können Sie dem Modell Influencer hinzufügen, um verschiedene Was-wäre-wenn-Szenarien auszuprobieren.

Verwenden des Ausgabebereichs

In diesem Modell soll zuerst der Einfluss verschiedener Faktoren auf die Dienstqualität dargestellt werden. Dazu können Sie die Dienstnote aus der Liste der Ausgabeattribute auswählen und dann verschiedene Dienstebenen vergleichen, indem Sie Bereiche aus den Dropdownlisten für Wert 1 und Wert 2 auswählen.

So vergleichen Sie die niedrigste und die höchste Dienstqualität
  1. Wählen Sie für Wert 1 den Bereich mit den niedrigsten Werten aus. Zum Beispiel stellt der Bereich 0-0-0,7 die niedrigsten Abbruchraten dar und damit die bestmögliche Dienstqualität.

    Hinweis

    Die genauen Werte in diesem Bereich variieren ggf. abhängig davon, wie Sie das Modell konfiguriert haben.

  2. Wählen Sie für Wert 2 den Bereich mit den höchsten Werten aus. Beispielsweise stellt der Bereich mit dem Wert >=0,12 die höchsten Abbruchraten und daher die schlechteste Dienstklasse dar. Der Wert bedeutet, dass 12% der eingehenden Kundenanrufe während dieser Schicht nicht durchgestellt werden konnten und der Kunde wieder aufgelegt hat.

    Der Inhalt des Bereichs "Variablen " wird aktualisiert, um Attribute zu vergleichen, die zu den Ergebniswerten beitragen. Die linke Spalte zeigt die Attribute an, die der besten Dienstqualität zugeordnet sind, und die rechte Spalte die Attribute für die schlechteste Dienstqualität.

Verwenden des Variablenbereichs

In diesem Modell scheint es Average Time Per Issue ein wichtiger Faktor zu sein. Diese Variable gibt die durchschnittliche Zeit an, nach der ein Aufruf beantwortet wird, unabhängig vom Anruftyp.

So können Sie Wahrscheinlichkeits- und Liftergebnisse für ein Attribut anzeigen und kopieren
  1. Zeigen Sie im Bereich "Variablen " mit der Maus über den farbigen Balken in der ersten Zeile.

    In diesem farbigen Balken wird gezeigt, wie stark Average Time Per Issue sie zur Dienstnote beiträgt. Die QuickInfo zeigt das Gesamtergebnis, die Wahrscheinlichkeiten und die Liftergebnisse für jede Kombination einer Variablen mit einem Zielergebnis an.

  2. Klicken Sie im Bereich "Variablen" mit der rechten Maustaste auf eine beliebige farbige Leiste, und wählen Sie "Kopieren" aus.

  3. Klicken Sie in einem Excel-Arbeitsblatt mit der rechten Maustaste auf eine beliebige Zelle, und wählen Sie "Einfügen" aus.

    Der Bericht wird als HTML-Tabelle eingefügt und zeigt nur die Ergebnisse für jede Leiste an.

  4. Klicken Sie in einem anderen Excel-Arbeitsblatt mit der rechten Maustaste auf eine beliebige Zelle, und wählen Sie "Inhalte einfügen" aus.

    Der Bericht wird im Textformat eingefügt und enthält die verwandten Statistiken, die im nächsten Abschnitt beschrieben werden.

Verwenden des Eingabebereichs

Angenommen, Sie interessieren sich für die Auswirkungen eines bestimmten Faktors, z. B. für die Schicht oder die Anzahl der Telefonisten. Sie können eine bestimmte Variable mithilfe des Eingabebereichs auswählen, und der Bereich "Variablen " wird automatisch aktualisiert, um die beiden zuvor ausgewählten Gruppen anhand der angegebenen Variablen zu vergleichen.

So überprüfen Sie die Auswirkungen auf die Dienstqualität beim Ändern von Eingabeattributen
  1. Wählen Sie im Eingabebereich für das Attribut umschalten.

  2. Wählen Sie für "Wert" "AM" aus.

    Der Bereich "Variablen" wird aktualisiert, um die Auswirkungen auf das Modell anzuzeigen, wenn die Schicht AM ist. Alle anderen Auswahlen bleiben gleich – Sie vergleichen immer noch die niedrigsten und höchsten Servicenoten.

  3. Wählen Sie für "Wert" "PM1" aus.

    Der Bereich "Variablen " wird aktualisiert, um die Auswirkungen auf das Modell anzuzeigen, wenn sich die Schicht ändert.

  4. Klicken Sie im Eingabebereich auf die nächste leere Zeile unter "Attribut", und wählen Sie "Anrufe" aus. Wählen Sie für "Wert" den Bereich aus, der die größte Anzahl von Anrufen angibt.

    Der Liste wird eine neue Eingabebedingung hinzugefügt. Im Bereich "Variablen " wird aktualisiert, um die Auswirkungen auf das Modell für eine bestimmte Schicht anzuzeigen, wenn die Anruflautstärke am höchsten ist.

  5. Ändern Sie weiter die Werte für Schicht und Anrufe, um ein genaues Bild der Wechselwirkungen zwischen den Werten für Schicht, Anrufaufkommen und Dienstqualität zu bekommen.

    Hinweis

    Um den Eingabebereich zu löschen, damit Sie unterschiedliche Attribute verwenden können, klicken Sie auf "Viewer-Inhalt aktualisieren".

Interpretieren der im Viewer bereitgestellten Statistiken

Längere Wartezeiten sind ein wesentlicher Vorhersagefaktor für eine hohe Abbruchrate und bedeuten eine schlechte Dienstqualität. Diese Schlussfolgerung scheint zunächst offensichtlich. Das Miningmodell stellt Ihnen jedoch einige zusätzliche statistische Daten bereit, mit denen Sie diese Trends umfassender interpretieren können.

  • Score: Value that indicates the overall importance of this variable for diskriminating between outcomes. Je höher das Ergebnis, desto stärker wirkt sich die Variable auf das Ergebnis aus.

  • Wahrscheinlichkeit von Wert 1: Prozentsatz, der die Wahrscheinlichkeit dieses Werts für dieses Ergebnis darstellt.

  • Wahrscheinlichkeit des Werts 2: Prozentsatz, der die Wahrscheinlichkeit dieses Werts für dieses Ergebnis darstellt.

  • Lift für Wert 1 und Heben für Wert 2: Bewertungen, die die Auswirkungen der Verwendung dieser bestimmten Variablen für die Vorhersage der Ergebnisse von Wert 1 und Wert 2 darstellen. Je höher das Ergebnis, desto besser sind die Ergebnisse, die mit dieser Variablen ermittelt werden können.

Die folgende Tabelle enthält einige Beispielwerte für die wichtigsten Einflussfaktoren. Die Wahrscheinlichkeit von Wert 1 ist beispielsweise 60,6 % und die Wahrscheinlichkeit des Werts 2 ist 8,30 %, was bedeutet, dass sich die Durchschnittliche Zeit pro Problem im Bereich von 44-70 Minuten befand, 60,6 % der Fälle in der Schicht mit den höchsten Dienstnoten (Wert 1) und 8,30 % der Fälle in der Schicht mit den schlechteren Dienstnoten (Wert 2).

Aus diesen Informationen lassen sich mehrere Schlussfolgerungen ableiten. Kürzere Antwortzeiten (der Bereich von 44-70) wirken sich sehr stark auf eine bessere Dienstqualität (der Bereich 0,00-0,07) aus. Das Ergebnis (92,35) besagt, dass diese Variable sehr wichtig ist.

Wenn Sie jedoch die Liste der Faktoren genauer überprüfen, finden Sie einige andere Faktoren, die weniger deutliche Auswirkungen haben und schwieriger zu interpretieren sind. Zum Beispiel scheint die Schicht die Dienstqualität zu beeinflussen, aber das Liftergebnis und die relativen Wahrscheinlichkeiten geben an, dass die Schicht kein Hauptfaktor ist.

attribute Wert Favorisiert < 0.07 Favors >= 0,12
Durchschnittliche Zeit pro Vorgang 89.087 - 120.000 Ergebnis: 100

Wahrscheinlichkeit von Wert1: 4,45 %

Wahrscheinlichkeit von Wert2: 51,94 %

Lift für Wert1: 0,19

Lift für Wert2: 1,94
Durchschnittliche Zeit pro Vorgang 44.000 - 70.597 Ergebnis: 92,35

Wahrscheinlichkeit von Wert 1: 60,06 %

Wahrscheinlichkeit von Wert 2: 8,30 %

Lift für Wert 1: 2,61

Lift für Wert 2: 0,31

Nach oben

Microsoft Generic Content Tree Viewer

Mit diesem Viewer können Sie die vom Algorithmus bei der Modellverarbeitung erstellten Informationen noch ausführlicher untersuchen. Der MicrosoftGeneric Content Tree Viewer stellt das Miningmodell als eine Reihe von Knoten dar, wobei jeder Knoten gelernte Kenntnisse über die Schulungsdaten darstellt. Dieser Viewer kann mit allen Modellen verwendet werden, die Inhalte der Knoten variieren jedoch abhängig vom Modelltyp.

Bei neuronalen Netzwerkmodellen oder logistischen Regressionsmodellen kann z. B. der marginal statistics node sehr nützlich sein. Dieser Knoten enthält abgeleitete Statistiken über die Werteverteilung in den Daten. Diese Informationen können nützlich sein, um ohne die Ausführung vieler T-SQL-Abfragen schnell eine Zusammenfassung der Daten zu erhalten. Das Diagramm mit Klassifizierungswerten im vorherigen Thema wurde aus dem Knoten für Randstatistiken abgeleitet.

So rufen Sie eine Zusammenfassung der Datenwerte aus dem Miningmodell ab

  1. Wählen Sie im Data Mining-Designer auf der <" den Namen des> Miningmodells aus.

  2. Wählen Sie in der Liste "Viewer" die Option "Microsoft Generic Content Tree Viewer" aus.

    Die Ansicht des Miningmodells wird aktualisiert und zeigt im linken Bereich eine Knotenhierarchie und im rechten Bereich eine HTML-Tabelle an.

  3. Klicken Sie im Bereich "Knotenbeschriftung " auf den Knoten mit dem Namen "10000000000000000000".

    Der oberste Knoten in jedem Modell ist immer der Modellstammknoten. In einem neuronalen Netzwerk oder logistischen Regressionsmodell ist der Knoten direkt unter diesem der Knoten für Randstatistiken.

  4. Scrollen Sie im Bereich "Knotendetails " nach unten, bis Sie die Zeile gefunden haben, NODE_DISTRIBUTION.

  5. Führen Sie einen Bildlauf nach unten bis zur Tabelle NODE_DISTRIBUTION durch, um die Werteverteilung anzuzeigen, die vom Neural Network-Algorithmus berechnet wurde.

Wenn Sie diese Daten in einem Bericht verwenden möchten, können Sie die Informationen für bestimmte Zeilen auswählen und anschließend kopieren, oder Sie können mit der folgenden DMX-Abfrage (Data Mining Extensions) den gesamten Inhalt des Knotens extrahieren.

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'  

Sie können auch die Knotenhierarchie und die Details in der Tabelle NODE_DISTRIBUTION verwenden, um einzelne Pfade im neuronalen Netzwerk zu durchlaufen und Statistiken in der verborgenen Ebene anzuzeigen. Weitere Informationen finden Sie unter Neural Network Model Query Examples.

Nach oben

Nächste Aufgabe in der Lektion

Hinzufügen eines Logistischen Regressionsmodells zur Call Center-Struktur (Lernprogramm für Zwischendatenbergbau)

Weitere Informationen

Miningmodellinhalt für neurale Netzwerkmodelle (Analysis Services - Data Mining)
Beispiele für Abfragen von neuronalen Netzwerkmodellen
Technische Referenz für den Microsoft Neural Network-Algorithmus
Ändern der Diskretisierung von Spalten in einem Miningmodell