Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Mit einem Genauigkeitsdiagramm können Sie ein Modell auf ein neues Dataset anwenden und anschließend bewerten, wie leistungsfähig das Modell ist. Das von diesem Assistenten erstellte Genauigkeitsdiagramm ist ein Liftdiagramm, bei dem es sich um einen Diagrammtyp handelt, der häufig zum Messen der Genauigkeit eines Data Mining-Modells verwendet wird. Bei diesem Genauigkeitsdiagrammtyp handelt es sich um eine grafische Darstellung der Verbesserung, die Sie durch das Verwenden des angegebenen Data Mining-Modells im Vergleich zu Vorhersagen nach dem Zufallsprinzip und dem Idealfall erhalten, dass 100 Prozent der Vorhersagen genau sind. Sie können mehrere Modelle in einem Diagramm vergleichen.
Beispiel
Angenommen, die Marketingabteilung von Adventure Works Cycles möchte eine zielgerichtete Mailingkampagne starten. Aus vergangenen Kampagnen weiß man, dass typischerweise mit einer Antwortquote von 10 Prozent zu rechnen ist. Eine Liste mit 10.000 potenziellen Kunden ist in einer Tabelle in der Datenbank gespeichert. Ausgehend von der typischen Antwortquote ist zu erwarten, dass 1.000 Kunden antworten.
Da die Werbung jedoch nur an 5.000 Kunden gesendet werden kann, verwendet die Marketingabteilung ein Miningmodell, um die 5.000 Kunden auszuwählen, die am wahrscheinlichsten auf die Werbung reagieren werden.
Bei einer willkürlichen Auswahl von 5.000 Kunden kann das Unternehmen nur mit 500 positiven Antworten rechnen, da in der Regel nur 10 Prozent der Zielgruppe antworten. Dieses Szenario wird von der Zufallslinie im Prognosegütediagramm dargestellt.
Wenn die Marketingabteilung für das gezielte Mailing jedoch ein Miningmodell verwendet, könnte sie im Fall eines perfekten Modells damit rechnen, von allen 1.000 kontaktierten Kunden, die vom Modell empfohlen wurden, Antworten zu erhalten. Dieses Szenario wird von der Ideallinie im Prognosegütediagramm dargestellt.
Verwenden des Genauigkeitsdiagramm-Assistenten
Beim Erstellen eines Genauigkeitsdiagramms müssen Sie auf eine bereits vorhandene Data Mining-Struktur verweisen. Sie können die Genauigkeit mehrerer Modelle messen, die auf dieser Struktur basieren, sofern sie das Gleiche vorhersagen.
Wenn Sie nicht sicher sind, welche Strukturen verfügbar sind, können Sie den Server durchsuchen. Weitere Informationen finden Sie unter Durchsuchen von Modellen in Excel (SQL Server Data Mining-Add-Ins)..
So erstellen Sie ein Genauigkeitsdiagramm
Klicken Sie auf das Menüband Data Mining-Client .
Klicken Sie in der Gruppe Genauigkeit und Validierung auf Genauigkeitsdiagramm.
Wählen Sie im Dialogfeld Struktur oder Modell auswählen das Modell aus, das Sie auswerten möchten. Klicken Sie auf Weiter.
Hinweis
Sie müssen ein Modell auswählen, das weitgehend mit den Daten übereinstimmt, die Sie überprüfen möchten.
Wählen Sie im Dialogfeld Vorherzusagende Spalte angeben und Wert für Vorhersage die Spalte aus, die Sie vorhersagen möchten, und ggf. einen Zielwert. Klicken Sie auf Weiter.
Im Beispiel oben könnten Sie beispielsweise die Spalte auswählen, die die Kundenreaktion wiedergibt, und den Zielwert als "Wird wahrscheinlich kaufen" festlegen.
Hinweis
Für kontinuierliche Werte können Sie keine Vorhersage erstellen. Sie können jedoch die Spalte diskretisieren, indem Sie die Werte in diskrete Wertebereiche aufteilen. Dies müssen Sie tun, bevor Sie das Data Mining-Modell erstellen.
Geben Sie im Dialogfeld Quelldaten auswählen die Quelle der Daten an, die Sie durch das Modell übergeben, um eine Vorhersage zu erstellen.
Wenn Sie eine externe Datenquelle und nicht die Testdaten verwenden, die mit dem Modell gespeichert sind, ordnen Sie im Dialogfeld Beziehungen angeben die Spalten in den neuen Quelldaten den spalten zu, die im Data Mining-Modell verwendet werden.
Wenn sich die Spaltennamen ähneln, werden sie automatisch vom Assistenten zugeordnet. Manche Spalten der Eingabedaten sind möglicherweise irrelevant für die Analyse und können deshalb ignoriert werden. Bestimmte Spalten sind jedoch erforderlich, damit die Eingabe vom Data Mining-Modell verarbeitet werden kann. Bei diesen Spalten handelt es sich möglicherweise um eine Transaktions-ID, den Zielwert oder Spalten, die für die Vorhersage verwendet werden. Wenn Sie eine erforderliche Spalte nicht zuordnen, gibt der Assistent eine Warnmeldung aus.
Klicken Sie auf Fertig stellen.
Der Assistent erstellt einen Bericht, der das Prognosegütediagramm und zugrunde liegende Daten enthält.
Anforderungen
Wenn Sie einen diskreten Wert vorhersagen, müssen Sie den Zielwert auswählen, den Sie vorhersagen möchten. Wenn Ihre Daten beispielsweise mit einer Antwort "Ja: Kaufen" als 1 und der Antwort "Nein: Nicht kaufen" als 2 kategorisiert werden, müssen Sie 1 oder 2 als Vorhersagewerte festlegen. Wenn Sie jedoch einen Wertebereich vorhersagen möchten, können Sie nur zwei Werte gleichzeitig vergleichen. Wenn Sie beispielsweise ein Ergebnis über 5 vorhersagen möchten, müssen Sie Ihre Quelldaten möglicherweise neu bezeichnen und ein neues Modell erstellen, in dem die Ergebnisse in zwei Gruppen aufgeteilt werden: größer als 5 und kleiner als 5 Anschließend können Sie die Genauigkeit dieser beiden Gruppen vergleichen.
Grundlegendes zur Genauigkeit
Sie können zwei Arten von Diagrammen erstellen: ein Diagramm, in dem Sie einen Status der vorhersagbaren Spalte angeben, und eines, in dem Sie den Status nicht angeben.
Wenn Sie den Status der vorhersagbaren Spalte angeben, stellt die X-Achse des Diagramms den Prozentsatz des Testdatasets dar, das zum Vergleichen der Vorhersagen verwendet wird. Die Y-Achse des Diagramms stellt den Prozentsatz der Werte dar, die für den angegebenen Status vorhergesagt werden.
Wenn Sie für den Status der vorhersagbaren Spalte nichts angeben, zeigt das Diagramm die Genauigkeit des Modells für alle möglichen Vorhersagen an.
Weitere Informationen dazu, wie ein Liftdiagramm funktioniert und wie die Genauigkeit basierend auf den zufälligen und idealen Vorhersagelinien berechnet wird, finden Sie im Thema "Lift chart" in SQL Server Books Online.
Weitere Informationen
Überprüfen von Modellen und Verwenden von Modellen für Vorhersagen (Data Mining-Add-Ins für Excel)