Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Logistische Regression ist eine bekannte statistische Technik, die zur Modellierung binärer Ergebnisse verwendet wird.
Es gibt verschiedene Implementierungen der logistischen Regression in der Statistikforschung mit unterschiedlichen Lerntechniken. Der Microsoft Logistic Regression-Algorithmus wurde mithilfe einer Variation des Microsoft Neural Network-Algorithmus implementiert. Dieser Algorithmus teilt viele der Qualitäten neuronaler Netzwerke, ist aber einfacher zu trainieren.
Ein Vorteil der logistischen Regression besteht darin, dass der Algorithmus hochflexibel ist und jede Art von Eingabe übernimmt und mehrere verschiedene analytische Aufgaben unterstützt:
Verwenden Sie demografische Daten, um Vorhersagen über Ergebnisse wie das Risiko für eine bestimmte Krankheit zu erstellen.
Untersuchen und gewichten Sie die Faktoren, die zu einem Ergebnis beitragen. Suchen Sie beispielsweise die Faktoren, die Kunden beeinflussen, wiederholt ein Geschäft zu besuchen.
Klassifizieren Sie Dokumente, E-Mail oder andere Objekte mit vielen Attributen.
Beispiel
Betrachten Sie eine Gruppe von Personen, die ähnliche demografische Informationen teilen und Produkte aus dem Adventure Works-Unternehmen kaufen. Indem Sie die Daten modellieren, die sich auf ein bestimmtes Ergebnis beziehen, z. B. den Kauf eines Zielprodukts, können Sie sehen, wie die demografischen Informationen zur Wahrscheinlichkeit eines Kaufs des Zielprodukts beitragen.
Funktionsweise des Algorithmus
Logistische Regression ist eine bekannte statistische Methode zur Bestimmung des Beitrags mehrerer Faktoren zu einem Ergebnispaar. Die Microsoft-Implementierung verwendet ein geändertes neurales Netzwerk, um die Beziehungen zwischen Eingaben und Ausgaben zu modellieren. Der Effekt jeder Eingabe auf die Ausgabe wird gemessen, und die verschiedenen Eingaben werden im fertigen Modell gewichtet. Die Namenslogistikregression kommt aus der Tatsache, dass die Datenkurve mithilfe einer logistischen Transformation komprimiert wird, um die Wirkung extremer Werte zu minimieren. Weitere Informationen zur Implementierung und zum Anpassen des Algorithmus finden Sie in der technischen Referenz zum Microsoft Logistic Regression Algorithm.
Für logistische Regressionsmodelle erforderliche Daten
Wenn Sie Daten für die Verwendung in der Schulung eines Logistischen Regressionsmodells vorbereiten, sollten Sie die Anforderungen für den jeweiligen Algorithmus verstehen, einschließlich der benötigten Daten und der Verwendung der Daten.
Die Anforderungen für ein logistisches Regressionsmodell sind wie folgt:
Eine einzelne Schlüsselspalte Jedes Modell muss eine numerische oder Textspalte enthalten, die jeden Datensatz eindeutig identifiziert. Zusammengesetzte Schlüssel sind nicht zulässig.
Eingabespalten Jedes Modell muss mindestens eine Eingabespalte enthalten, die die Werte enthält, die als Faktoren in der Analyse verwendet werden. Sie können beliebig viele Eingabespalten haben, aber je nach Anzahl der Werte in jeder Spalte kann das Hinzufügen zusätzlicher Spalten die Zeit erhöhen, die zum Trainieren des Modells benötigt wird.
Mindestens eine vorhersagbare Spalte Das Modell muss mindestens eine vorhersagbare Spalte eines beliebigen Datentyps enthalten, einschließlich fortlaufender numerischer Daten. Die Werte der vorhersagbaren Spalte können auch als Eingaben für das Modell behandelt werden, oder Sie können angeben, dass sie nur für die Vorhersage verwendet wird. Geschachtelte Tabellen sind für vorhersagbare Spalten nicht zulässig, können aber als Eingaben verwendet werden.
Ausführlichere Informationen zu den Inhaltstypen und Datentypen, die für logistische Regressionsmodelle unterstützt werden, finden Sie im Abschnitt "Anforderungen" des Technischen Referenz zum Microsoft Logistic Regression Algorithm.
Anzeigen eines Logistischen Regressionsmodells
Um das Modell zu erkunden, können Sie den Microsoft Neural Network Viewer oder den Microsoft Generic Content Tree Viewer verwenden.
Wenn Sie das Modell mithilfe des Microsoft Neural Network Viewer anzeigen, zeigt Analysis Services die Faktoren an, die zu einem bestimmten Ergebnis beitragen und nach ihrer Wichtigkeit bewertet werden. Sie können ein zu vergleichende Attribut und Werte auswählen. Weitere Informationen finden Sie unter Durchsuchen eines Modells mithilfe des Microsoft Neural Network Viewers.
Wenn Sie mehr wissen möchten, können Sie die Modelldetails mithilfe der Generischen Inhaltsstrukturanzeige von Microsoft durchsuchen. Der Modellinhalt für ein logistisches Regressionsmodell enthält einen marginalen Knoten, der Ihnen die für das Modell verwendeten Eingaben und Subnetze für die vorhersagbaren Attribute anzeigt. Weitere Informationen finden Sie unter Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining).
Erstellen von Vorhersagen
Nachdem das Modell trainiert wurde, können Sie Abfragen für den Modellinhalt erstellen, um die Regressionskoeffizienten und andere Details abzurufen, oder Sie können das Modell verwenden, um Vorhersagen zu erstellen.
Allgemeine Informationen zum Erstellen von Abfragen für ein Data Mining-Modell finden Sie unter Data Mining-Abfragen.
Beispiele für Abfragen zu einem logistischen Regressionsmodell finden Sie unter Clustering Model Query Examples.
Bemerkungen
Unterstützt keine Drillthrough. Dies liegt daran, dass die Struktur der Knoten im Miningmodell nicht unbedingt direkt den zugrunde liegenden Daten entspricht.
Unterstützt nicht die Erstellung von Data Mining-Dimensionen.
Unterstützt die Verwendung von OLAP-Miningmodellen.
Unterstützt nicht die Verwendung von Predictive Model Markup Language (PMML) zum Erstellen von Miningmodellen.
Siehe auch
Miningmodellinhalt für Logistische Regressionsmodelle (Analysis Services - Data Mining)
Technische Referenz zum Microsoft Logistics Regressionsalgorithmus
Beispiele für Die Abfrage des Logistischen Regressionsmodells