Share via


Klassifikationsmatrix (SQL Server Data Mining-Add-Ins)

Schaltfläche

Mithilfe der Klassifikationsmatrix können Sie die Genauigkeit eines Modells in Bezug auf Vorhersagen bewerten. Um eine Klassifikationsmatrix zu erstellen, führen Sie ein Testdataset für das Modell aus. Das Tool Klassifikationsmatrix vergleicht die tatsächlichen Werte aus dem Testsatz mit den vom Modell getroffenen Vorhersagen. Indem Sie die Matrix überprüfen, können Sie auf Anhieb feststellen, wie oft das Modell richtige Vorhersagen und wie oft es falsche Vorhersagen trifft.

Verwenden Sie in diesen Add-Ins den Klassifizierungsmatrix-Assistenten , um ein Modell auszuwählen, die Testdaten anzugeben und dann eine Ergebnismatrix zu generieren.

Interpretieren einer Klassifikationsmatrix

Angenommen, Ihr Ziel besteht darin, ein Kundenbindungsprogramm zu entwerfen und kunden dann entsprechenden Kategorien zuzuweisen, damit Sie ihnen das entsprechende Maß an Anreizen bieten können. Sie haben drei Stufen für das Belohnungsprogramm implementiert – Bronze, Silber und Gold – und haben diese in einer Testphase an Kunden verteilt. Zusätzlich haben Sie ein Modell entworfen, mit dem Kunden analysiert und die richtigen Kategorien vorhergesagt werden. Jetzt ermitteln Sie anhand der Klassifikationsmatrix und der Testdaten, wie gut das Modell bei der Vorhersage des richtigen Angebots für alle Kunden abgeschnitten hat.

An der Tabelle der Klassifikationsmatrix können Sie ablesen, wie viele Kunden auf Grundlage des Modells den einzelnen Kategorien zugewiesen würden, und das Ergebnis mit der Anzahl der Kunden vergleichen, die sich tatsächlich für die einzelnen Bonusstufen eingetragen haben.

Bronze (IST-Wert) Gold (IST-Wert) Silber (IST-Wert)
Bronze 94.45% 15.18% 1,70%
Gold 2,72 % 84.82% 0,00 %
Silber 1.84% 0,00 % 93.80%
Richtig 95.45% 84.82% 98.30%
Falsch klassifiziert 4.55% 15.18% 1.70%
  • In jeder Spalte werden die tatsächlichen Werte im Testdataset angezeigt.

  • In jeder Zeile werden die vorhergesagten Werte angezeigt.

  • Die fett dargestellten Werte, die in der Matrix diagonal von der oberen linken zur unteren rechten Ecke verlaufen, zeigen, welche Vorhersagen vom Modell richtig getroffen wurden.

  • Alle anderen Werte außerhalb der Diagonalen stellen Fehler dar. Einige Fehler sind falsch positive Ergebnisse. Dies bedeutet, dass vom Modell vorhergesagt wurde, dass der Kunde am Gold-Programm teilnehmen würde, die Annahme aber falsch war. Abhängig von Ihrer Problemdomäne können falsch positive Ergebnisse erhebliche Kosten verursachen.

    Andere Fehler sind falsch negative Ergebnisse. Dies bedeutet, dass vom Modell vorhergesagt wurde, dass der Kunde kein Interesse zeigen würde, obwohl er letztlich am Programm teilgenommen hat. Auch hier kann die entgangene Geschäftschance abhängig von der Problemdomäne erhebliche Verluste verursachen.

Verwenden des Klassifikationsmatrix-Assistenten

  1. Wählen Sie das Miningmodell aus, auf dem die Vorhersagen basieren sollen.

  2. Wählen Sie eine Quelle für neue Testdaten aus, oder verwenden Sie die mit der Struktur gespeicherten Testdaten.

  3. Wählen Sie die Spalte aus, deren Genauigkeit Sie überprüfen möchten. Sie können beim Erstellen einer Matrix nur eine Spalte auswählen, allerdings kann die Spalte mehrere Werte enthalten.

    Tipp: Die Interpretation einer Klassifikationsmatrix kann schwierig werden, wenn für die vorhersagbare Spalte viele Vergleichsspalten vorhanden sind.

    Auf der Seite Spalten für Vorhersage auswählen können Sie auch angeben, ob Sie die Anzahl falscher und falscher Werte oder einen Prozentsatz anzeigen möchten.

  4. Geben Sie auf der Seite Quelldaten auswählen an, ob Sie externe Testdaten oder die mit dem Modell gespeicherten Testdaten verwenden.

  5. Wenn Sie externe Testdaten verwenden, müssen Sie das Modell den Eingabespalten auf der Seite Beziehung angeben des Assistenten zuordnen.

    Bei Verwendung des eingebetteten Testdatasets erfolgt die Zuordnung automatisch.

  6. Klicken Sie auf Fertig stellen , um Vorhersagen für das Modell auszuführen und die Klassifizierungsmatrix zu generieren.

    Vom Assistenten wird ein Bericht erstellt, der die Klassifikationsmatrix und andere Details der Analyse enthält. Der Bericht wird als Tabelle in Excel gespeichert. Oberhalb des Berichts befindet sich eine Zusammenfassung, die angibt, wie viele Fälle richtig vorhergesagt wurden und wie viele Vorhersagen falsch waren.

Anforderungen

  • Zum Erstellen einer Klassifikationsmatrix benötigen Sie Zugriff auf ein vorhandenes Miningmodell, das Genauigkeitsmessungen unterstützt. Vorhersagemodelle und Zuordnungsmodelle können nicht mithilfe dieses Tools ausgewertet werden.

  • Das untersuchte Modell muss einen Wert vorhersagen, der entweder diskret ist oder bereits diskretisiert wurde.

  • Wenn Sie die Option zum Speichern eines Testsatzes zusammen mit Ihrer Struktur oder Ihrem Modell nicht verwendet haben, müssen Sie ein Eingabedataset abrufen, das im Wesentlichen die gleiche Anzahl von Spalten mit übereinstimmenden Datentypen wie die im Modell verwendeten enthält.

  • Sowohl das Data Mining-Modell als auch die neuen Daten, die Sie für den Test verwenden, müssen mindestens eine Spalte enthalten, die vorhergesagt werden kann, und die Spalten müssen denselben Datentyp enthalten.

Bekannte Probleme

In SQL Server 2012 und SQL Server 2014 funktioniert die Möglichkeit, den internen Testdatensatz dem Modell zuzuordnen, im Klassifizierungsmatrixtool nicht. Sie können jedoch ein externes Dataset angeben und anschließend den Trainingssatz als Eingabe auswählen, um Fehler im ursprünglichen Dataset zu ermitteln.

Weitere Informationen

Überprüfen von Modellen und Verwenden von Modellen für Vorhersagen (Data Mining-Add-Ins für Excel)
Daten durchsuchen (SQL Server Data Mining-Add-Ins)
Kategorien erkennen (Tabellenanalysetool für Excel)