Untersuchen des Naive Bayes-Modells (Lernprogramm zu Data Mining-Grundlagen)
Der Microsoft Naive Bayes-Algorithmus stellt mehrere Methoden zum Anzeigen von Interaktionen zwischen dem Fahrradkaufverhalten und den Eingabeattributen bereit.
Der Microsoft Naive Bayes-Viewer bietet die folgenden Registerkarten zum Durchsuchen von Naive Bayes-Miningmodellen:
Dependency Network
Attribute Profiles
Attribute Characteristics
Attribute Discrimination
In den folgenden Abschnitten wird beschrieben, wie die anderen Miningmodelle geprüft werden.
Abhängigkeitsnetzwerk
Die Registerkarte Abhängigkeitsnetzwerk entspricht der Registerkarte Abhängigkeitsnetzwerk des Microsoft Struktur-Viewers. Jeder Knoten im Viewer steht für ein Attribut, und die Linien zwischen den Knoten stellen Beziehungen dar. In dem Viewer können Sie alle Attribute sehen, die sich auf den Status des vorhersagbaren Attributs Bike Buyer auswirken.
So untersuchen Sie das Modell auf der Registerkarte "Abhängigkeitsnetzwerk"
Verwenden Sie die Liste Miningmodell oben auf der Registerkarte Miningmodell-Viewer, um zum TM_NaiveBayes zu wechseln.
Verwenden Sie die Liste Viewer, um zum Microsoft Naive Bayes-Viewer zu wechseln.
Klicken Sie auf den Knoten Fahrradkäufer, um die zugehörigen Abhängigkeiten zu identifizieren.
Die rosa Schattierung gibt an, dass alle Attribute Auswirkungen auf den Fahrradkauf haben.
Stellen Sie den Schieberegler ein, um die einflussreichsten Attribute zu identifizieren.
Wenn Sie den Schieberegler nach unten ziehen, werden nur noch diejenigen Attribute angezeigt, welche die stärksten Auswirkungen auf die [Bike Buyer]-Spalte haben. Durch Anpassen des Schiebereglers können Sie herausfinden, dass die einflussreichsten Attribute unter anderem folgende sind: Anzahl der Autos im Besitz, Arbeitsweg und Anzahl der Kinder insgesamt.
Zurück zum Anfang
Attributprofile
Über die Registerkarte Attributprofile wird beschrieben, wie sich verschiedene Status der Eingabeattribute auf das Ergebnis des vorhersagbaren Attributs auswirken.
So untersuchen Sie das Modell auf der Registerkarte "Attributprofile"
Stellen Sie sicher, dass im Feld Vorhersagbar die Option Bike Buyer ausgewählt ist.
Wenn die Anzeige von Attributprofilen durch die Mininglegende blockiert wird, verschieben Sie diese.
Wählen Sie im Leistenfeld des Histogramms die Option 5 aus.
In unserem Modell stellt 5 die maximale Anzahl der Status einer Variablen dar.
Die Attribute, die sich auf den Status des vorhersagbaren Attributs auswirken, werden zusammen mit den Werten für jeden Status der Eingabeattribute und deren Verteilungen in jedem Status des vorhersagbaren Attributs aufgelistet.
Suchen Sie in der Spalte Attribute den Eintrag Number Cars Owned. Beachten Sie die Unterschiede in den Histogrammen für Kunden, die ein Fahrrad gekauft haben (Spalte 1) und Kunden, die keinen Kauf getätigt haben (Spalte 0). Personen, die kein oder ein Auto besitzen, kaufen mit größerer Wahrscheinlichkeit ein Fahrrad.
Doppelklicken Sie auf die Zelle Number Cars Owned in der Spalte Bike Buyer (Spalte 1).
Die Mininglegende zeigt eine ausführlichere Sicht an.
Zurück zum Anfang
Attributmerkmale
Auf der Registerkarte Attributmerkmale können Sie ein Attribut und einen Wert auswählen, um festzustellen, mit welcher Häufigkeit Werte für andere Attribute in den ausgewählten Fällen auftreten.
So untersuchen Sie das Modell auf der Registerkarte "Attributmerkmale"
Überprüfen Sie in der Liste Attribut, dass Bike Buyer ausgewählt wird.
Legen Sie den Wert auf 1 fest.
Im Viewer sehen Sie, dass Kunden, die keine Kinder zu Hause und einen kurzen Arbeitsweg haben und in Nordamerika leben mit größerer Wahrscheinlichkeit ein Fahrrad kaufen.
Zurück zum Anfang
Attributunterscheidung
Mithilfe der Registerkarte Attributunterscheidung können Sie die Beziehung zwischen zwei diskreten Werten für das Fahrradkaufverhalten und anderen Attributwerten prüfen. Da es im TM_NaiveBayes nur zwei Status gibt, nämlich 1 und 0, brauchen Sie im Viewer keine Änderungen vorzunehmen.
Im Viewer können Sie sehen, dass Personen, die keine Autos besitzen, tendenziell Fahrräder kaufen. Personen, die zwei Autos besitzen, kaufen tendenziell keine Fahrräder.
Vorherige Aufgabe in der Lektion
Untersuchen des Clustering-Modells (Lernprogramm zu Data Mining-Grundlagen)
Siehe auch