Share via


Vorhersagerechner (Tabellenanalysetools für Excel)

Tool für Vorhersagerechner

Mit dem Tool "Vorhersagerechner " können Sie eine Scorecard erstellen, mit der neue Daten analysiert und Optionen oder Risiken ausgewertet werden können. Wenn Sie beispielsweise über verlaufsbezogene und demografische Daten zu Kunden verfügen, kann Das Tool Vorhersagerechner Ihnen bei zwei wichtigen Aufgaben helfen:

  • Generieren einer zugrunde liegenden Analyse der demografischen Daten, des Kaufverhaltens und verschiedener anderer Faktoren.

  • Erstellen einer Arbeitsscorecard, mit der Sie die Elemente auswerten und Empfehlungen für neue Produkt- oder Serviceangebote abgeben können.

Der Assistent erstellt darüber hinaus ein Arbeitsblatt, in dem sämtliche zugrunde liegende Berechnungen gespeichert sind. Auf diese Weise können Sie mit dem Modell interagieren und feststellen, welche Auswirkungen unterschiedliche Eingabewerte auf das Endergebnis haben.

Wenn Sie dies auswählen, kann der Assistent auch eine gedruckte Version des Arbeitsblatts erstellen, die Sie für Bewertungen unabhängig vom Computer verwenden können. Sie können mit dem Modell nicht so interagieren wie auf dem Computer mit der Excel-Arbeitsmappe, aber die gedruckte Version bietet alle Berechnungen, die Sie benötigen, um Werte einzugeben und das Endergebnis zu berechnen.

Verwenden des Tools Vorhersagerechner

  1. Öffnen Sie eine Excel-Tabelle mit den zu analysierenden Daten.

  2. Klicken Sie auf der Registerkarte Analysieren auf Vorhersagerechner.

  3. Wählen Sie im Dialogfeld Vorhersagerechner für Ziel die Spalte aus, die Sie vorhersagen möchten, z. B. das Kaufverhalten.

  4. Geben Sie den Zielwert an. Wenn der Wert numerisch ist, verwenden Sie die Option In Bereich, und geben Sie dann die Minimal- und Höchstwerte für den gewünschten Bereich ein. Wenn der Wert diskret ist, wählen Sie die Option Genau aus, und wählen Sie dann den Wert aus der Dropdownliste aus.

  5. Klicken Sie auf Spalten auswählen, die für die Analyse verwendet werden sollen.

  6. Wählen Sie im Dialogfeld Erweiterte Spaltenauswahl Spalten aus, die nützliche Informationen enthalten. Entfernen Sie alle Spalten, die für die Analyse nicht relevant sind. Klicken Sie auf OK.

    Um eine Verzerrung der Ergebnisse zu vermeiden, sollten Sie auch die Spalten entfernen, die doppelte Informationen enthalten. Wenn Sie beispielsweise eine Spalte Einkommen haben, die numerische Daten enthält, und eine Spalte Einkommensgruppe, die die Bezeichnungen Hoch, Mittel und Niedrig enthält, sollten Sie nicht beide Spalten in dasselbe Modell aufnehmen. Stattdessen könnten Sie ein separates Modell für jede Spalte erstellen.

  7. Wählen Sie im Abschnitt Ausgabeoptionendie Option Betriebsrechner aus, um die Analyse und Scorecard in einer Excel-Arbeitsmappe zu erstellen. Wählen Sie Druckerfähiger Rechner aus, um die Analyse zu erstellen und einen Bericht zu generieren, der von Hand gedruckt und für die Bewertung verwendet werden kann.

  8. Klicken Sie auf Ausführen.

    Das Tool erstellt neue Arbeitsblätter, die die Berichte und die Scorecards enthalten.

Anforderungen

Das Tool für den Vorhersagerechner verwendet den Microsoft Logistic Regression-Algorithmus, der mit diskreten Werten sowie mit diskreten und kontinuierlichen numerischen Daten arbeiten kann.

Grundlegendes zu den Bewertungsberichten

Wenn Sie beide Ausgabeoptionen aktivieren, erstellt der Vorhersagerechner die folgenden drei neuen Arbeitsblätter in der aktuellen Arbeitsmappe:

  • Ein Vorhersageberichtmit den Analyseergebnissen sowie interaktiven Tabellen und Diagrammen, mit denen Sie mit Interaktionen und Gewinnen experimentieren können.

  • Ein interaktiver Vorhersagerechner , mit dem Sie Bewertungen erstellen können.

  • Ein druckbarer Rechner mit Anweisungen und Koeffizienten, die bei der Bewertung verwendet werden sollen.

  • In diesem Abschnitt werden die Informationen in den einzelnen Berichten und die Verwendung der verschiedenen Berichtsoptionen beschrieben.

Vorhersagebericht mit Diagrammen

Der erste Vorhersagebericht trägt den Titel Vorhersagerechnerbericht für den <Zielzustand des Zielattributes><>. Er enthält aus der Analyse abgeleitete Tabellen und Faktoren sowie Tools, mit denen Sie die finanziellen Auswirkungen einer bestimmten Analyse bewerten können.

Tabelle zum Angeben von Kosten und Gewinnen

Das erste Tool dieses Berichts befindet sich oben links im Bericht. Es ist eine Tabelle, in der Sie die Kosten und Gewinne angeben können, die mit der richtigen und falschen Vorhersage eines Werts verbunden sind. Diese Kosten und Gewinne sind erforderlich, um für den Rechner den optimalen Ergebnisschwellenwert zu berechnen.

Element Beschreibung und Beispiel
Falsch positive Kosten Die Kosten der Annahme, dass das Modell richtigerweise ein positives Ergebnis vorhergesagt, wobei die Vorhersage eigentlich falsch ist.

Beispielsweise sagt das Modell vorher, dass ein Kunde etwas kaufen wird. Basierend darauf erarbeiten Sie eine Kampagne, die auf den Kunden ausgerichtet ist. Sie könnten die Kosten für Kundenkontakte hier eingeben.
Falsch negative Kosten Die Kosten der Annahme, dass das Modell richtigerweise ein negatives Ergebnis vorhergesagt, wobei die Vorhersage eigentlich falsch ist.

Beispielsweise kann das Modell vorhersagen, dass ältere Kunden eher keine Fahrräder kaufen. Sie stellen aber fest, dass das Modell verzerrt war und dass Sie deshalb die Gelegenheit verpasst haben, sich an ältere Kunden zu wenden. Sie könnten hier Kosten der entgangenen Gelegenheit angeben.
Richtig positiver Gewinn Der Gewinn eines richtig vorhergesagten positiven Ergebnisses. Wenn Sie beispielsweise bei einer Verkaufsaktion die richtigen Kunden ansprechen und Kundenkontakte entstehen, würden Sie hier den Gewinn pro Kunde eingeben.
Richtig negativer Gewinn Der Gewinn eines richtig vorhergesagten negativen Ergebnisses.

Wenn Sie beispielsweise die Kunden, die angesprochen werden sollten, richtig bestimmen können, könnten Sie hier die Zahl X als Werbeaufwand pro Kunde angeben.

Diagramm zum Anzeigen des maximalen Gewinns

Bei der Eingabe von Werten in die Tabelle werden die entsprechenden Diagramme automatisch aktualisiert, damit Sie sehen können, wo für das aktuelle Modell der optimale Punkt zur Maximierung des Gewinns ist. Das Liniendiagramm rechts neben dieser Tabelle zeigt den Gewinn für verschiedene Ergebnisschwellenwerte an. Der Gewinn wird anhand der Zahlen für Gewinn und Kosten geschätzt, die Sie in die Tabelle eingeben, und basierend auf den Vorhersagen und Wahrscheinlichkeiten des Modells.

Wenn beispielsweise in der linken oberen Tabelle die Zelle für Vorgeschlagener Schwellenwert zur Gewinnmaximierung den Wert 500 anzeigt, zeigt das Diagramm auf der rechten Seite 500 als höchsten Punkt im Liniendiagramm an. Dieser Wert 500 bedeutet, dass Sie zur Maximierung der Gewinne die ersten 500 Empfehlungen des Miningmodells, sortiert nach Wahrscheinlichkeit, verwenden sollten.

Tabelle mit den Ergebnissen für jedes Attribut und jeden Wert

Die Tabelle unten links im Bericht zeigt eine detaillierte Analyse der gefundenen Werte sowie die Auswirkungen der Werte auf das Ergebnis. Sie können die Werte nicht in dieser Tabelle ändern. Sie werden angezeigt, um Ihnen beim Verständnis der Vorhersage zu helfen.

Die folgende Tabelle zeigt ein Beispiel der Ergebnisse, wenn es das Ziel ist, dass ein Kunde ein Fahrrad kauft. In der Tabelle wird jede Eingabespalte aufgeführt, die im Modell verwendet wurde, unabhängig davon, ob die Eingabe das Modell beeinflusst hat. In der Tabelle werden auch die diskreten Werte und die diskretisierten Werte aufgelistet, wenn die Eingabespalte kontinuierliche numerische Daten enthält.

Die Werte in der Spalte Relative Auswirkung sind Wahrscheinlichkeiten, die als Prozentwerte dargestellt werden. Die Zelle wird schattiert, um die Auswirkung dieses Werts auf die Ergebnisse grafisch darzustellen.

Attribut Wert Relative Auswirkung
Marital Status Verheiratet 0
Marital Status Single 71
Geschlecht Female 13
Geschlecht Male 0

Sie können diese Faktoren wie folgt interpretieren:

  • Verheiratet zu sein beeinflusst die Wahrscheinlichkeit nicht, dass der Kunde ein Fahrrad kauft.

  • Ledig zu sein ist jedoch ein starker Indikator (70 Prozent) dafür, dass der Kunde wahrscheinlich ein Fahrrad kauft.

  • Das Geschlecht des Kunden hat nur geringe Auswirkungen (13 %) auf das vorhergesagte Kaufverhalten im Hinblick auf Fahrräder, wenn der Kunde eine Frau ist. Ist der Kunde ein Mann, hat das Geschlecht gar keine Auswirkungen auf dieses Verhalten.

Diagramm der kumulativen Kosten der falschen Klassifizierung

Das Flächendiagramm unten rechts im Bericht zeigt die kumulativen Kosten der falschen Klassifizierung für verschiedene Ergebnisschwellenwerte an. Dieses Diagramm nutzt außerdem die Zahlen für Kosten und Gewinne, die Sie als falsch und richtig positive Werte und als falsch und richtig negative Werte eingegeben haben.

Anders als das Diagramm oben rechts im Bericht, das die Maximierung des Gewinns zum Schwerpunkt hat, werden in dieses Diagramm auch die Kosten einer falschen Vorhersage eingearbeitet. Dieses Diagramm ist beispielsweise zur Vorbeugung sehr nützlich, wenn die Kosten einer falschen Entscheidung beträchtlich höher sind als die Kosten einer richtigen Annahme.

Obwohl das erste Diagramm vorschlägt, dass Sie Ihre Gewinne maximieren können, indem Sie die ersten 500 vom Modell vorhergesagten Kunden erreichen, könnten Sie sich beispielsweise nach einem Blick auf dieses zweite Diagramm entscheiden, dass die Kosten zu hoch sind, wenn diese Kunden fälschlicherweise angesprochen werden. Sie entschließen sich deshalb dazu, die Marketingkampagne auf die ersten 400 Kunden zu beschränken.

Interaktiver Vorhersagerechner

Das zweite arbeitsblatt, das vom Tool "Vorhersagerechner" erstellt wurde, heißt Vorhersagerechner für den <Zielzustand> des Zielattributes<>. Es ist ein interaktives Arbeitsblatt, mit dem Sie einzelne Ergebnisse berechnen können. Da dieses Arbeitsblatt im Modell gespeicherte Muster und Statistiken nutzt, können Sie mit unterschiedlichen Werten experimentieren und deren Auswirkungen auf das vorhergesagte Ergebnis ermitteln. Dieser Bericht weist auch zwei Abschnitte auf: Einer ist interaktiv, und einer dient als Referenz.

Erste Tabelle

Sie können einen neuen Wert in der Spalte Wert der Tabelle auswählen oder eingeben, um zu sehen, wie sich die Änderung des Werts auf die Bewertung auswirkt.

Wenn der Bericht beispielsweise die folgenden Werte enthält, können Sie den Wert für Autos auf 1 reduzieren und dann auf 0, um festzustellen, wie sich dies auf das Kaufverhalten der Kunden auswirkt. Wenn Sie den Wert von Cars in 0 ändern, ändert sich die Vorhersage unten in TRUE.

Attribut Wert Relative Auswirkung
Marital Status Verheiratet 0
Geschlecht Male 0
Income 39050 - 71062 117
Children 0 157
Education Bachelor 22
Occupation Skilled Manual 33
Wohneigentum Ja 8
Autos 2 50
Commute Distance 0-1 Meilen 99
Region Nordamerika 0
Age 37 - 46 5
Gesamt 491
Vorhersage für 'Ja' FALSE

Wenn Sie den neuen Wert eingeben, werden auch die in der Zelle angezeigte Bewertung, Vorhersage für Ja, in TRUE geändert, und die Relativen Auswirkungsbewertungen für die verschiedenen Attribute werden ebenfalls aktualisiert.

Hinweis

Auch wenn Sie nur einen Wert ändern, beispielsweise die Anzahl der Autos, können sich die Werte und Auswirkungen anderer Attribute ebenfalls ändern. Der Grund dafür ist, dass Data Mining-Modelle häufig komplexe Beziehungen zwischen Daten finden. Die Änderung einer Variablen kann dann unvorhergesehene Auswirkungen haben. Deshalb empfehlen wir, mithilfe des interaktiven Vorhersagerechners mit unterschiedlichen Werten zu experimentieren. Sie können auch das Miningmodell durchsuchen, damit Sie die Interaktionen besser verstehen. Weitere Informationen finden Sie unter Durchsuchen von Modellen.

Ergebnisaufschlüsselung

In dieser Tabelle sind die einzelnen Ergebnisse für jeden Zustand der Eingabespalten und die relative Auswirkung auf die Ergebnisse dargestellt. Diese Tabelle ist statisch und dient nur als Referenz.

Druckbarer Vorhersagerechner

Das dritte Arbeitsblatt, das vom Vorhersagerechner-Tool erstellt wird, heißt PrintablePrediction Calculator für den <Zielzustand des Zielattributes><>. Die Scorecard ist zum Drucken vorgesehen, sodass Sie manuell Ergebnisse berechnen können, wenn Sie nicht am Computer sind.

So drucken und verwenden Sie den vom Vorhersagerechner generierten Bewertungsbericht
  1. Klicken Sie auf die Registerkarte mit dem Titel Druckbarer Vorhersagerechner für <Attribut>.

  2. Wählen Sie im Menü Excel-Datei die Option Seitenansicht aus.

  3. Ändern Sie die Seitenausrichtung, die Ränder und andere Druckoptionen, bis die Scorecard wie gewünscht auf die Seite passt.

    Diese Scorecard ist nicht dynamisch und in keiner Weise mit dem Modell verbunden. Sie können also Spalten oder Zeilen verschieben, und dies hat keine Auswirkungen auf die zugrunde liegenden Daten.

  4. Drucken Sie die Scorecard.

  5. Wählen Sie für jedes Attribut nur einen Wert aus. Setzen Sie für den ausgewählten Wert ein Häkchen in das Kontrollkästchen, und schreiben Sie die entsprechende Zahl in die Spalte Score .

  6. Geben Sie möglichst viele Attribute an, um Genauigkeit sicherzustellen.

  7. Berechnen Sie die Summe der Bewertungen für jedes Attribut, und geben Sie diese Zahl in die Zeile Gesamt ein.

  8. Konvertieren Sie die Bewertung in ein vorhergesagtes Ergebnis, indem Sie die Kriterien verwenden, die unmittelbar nach der Zeile Gesamt auf dem Blatt gedruckt werden.

Analysis Services stellt den Microsoft Logistic Regression-Algorithmus für diese Art von Analyse bereit. Wenn Sie bereits mit der logistischen Regression vertraut sind, können Sie ganz einfach logistische Regressionsmodelle erstellen, indem Sie die Option Erweitert des Data Mining-Clients für Excel verwenden. Weitere Informationen finden Sie unter Erweiterte Modellierung (Data Mining-Add-Ins für Excel). Weitere Informationen zu den Optionen und Parametern für logistische Regressionsmodelle finden Sie im Thema "Microsoft Logistic Regression Algorithm" in SQL Server-Onlinedokumentation.

Weitere Informationen

Tabellenanalysetools für Excel