Freigeben über


Erstellen eines Data Mining-Modells

Die Datenmodellierung ist der Schritt des Data Mining, in dem Sie Muster und Trends erstellen, indem Sie Algorithmen auf Daten anwenden. Später können Sie diese Muster für die Analyse verwenden oder Vorhersagen erstellen.

Die Data Mining-Add-Ins für Office unterstützen Data Mining mithilfe von Assistenten, die das Erstellen von Modellen erleichtern. Die Assistenten analysieren die Daten, identifizieren Korrelationen, berechnen statistische Bedeutung aller Variablen und wählen automatisch das beste Modell aus.

Obwohl diese Funktionalität genauso leistungsfähig ist wie die Data Mining-Tools, die von SQL Server Analysis Services und SQL Server Data Tools (SSDT) bereitgestellt werden, erleichtert die Kombination von Assistenten und der vertrauten Excel-Schnittstelle das Erstellen, Ändern und Verwenden des Data Minings.

Erweitert (Data Mining)

Mit den erweiterten Assistenten können Sie neue Data Mining-Modelle erstellen, die auf in Excel gespeicherten Daten basieren, indem Sie einen der Data Mining-Algorithmen in SQL Server Analysis Services verwenden.

Die Miningstruktur erstellen

Der Assistent zum Erstellen einer Data Mining-Struktur hilft Ihnen dabei, eine neue Struktur zu erstellen, die Sie als Grundlage für mehrere Miningmodelle verwenden können. Der Assistent bietet Ihnen die Möglichkeit, einen Teil der Daten, die als Testsatz verwendet werden sollen, aufzuheben, damit Sie alle Modelle auswerten können, die dieselben Daten gemäß einem konsistenten Teststandard verwenden.

Miningstruktur erstellen (SQL Server Data Mining-Add-Ins)

Modell zur Struktur hinzufügen

Mit dem Assistenten zum Hinzufügen von Modell zu Struktur können Sie eine vorhandene Data Mining-Struktur auswählen und ein neues Data Mining-Modell dafür erstellen. Sie können einer Struktur mehrere Miningmodelle hinzufügen, die Parameter ändern oder verschiedene Data Mining-Algorithmen auswählen und die Ausgabe anpassen.

Modell zur Struktur hinzufügen (Data Mining-Add-Ins für Excel)

Analysiere Schlüsseleinflussnehmer (Analysiere)

Sie wählen eine Spalte oder einen Interessanten Ausgabewert aus, und dann analysiert der Algorithmus alle Eingabedaten, um die Faktoren zu identifizieren, die den größten Einfluss auf das Ziel haben. Optional können Sie einen Bericht erstellen, der zwei Werte vergleicht, sodass Sie sehen können, wie sich die Influencer ändern.

Das Tool "Wichtige Influencer analysieren " verwendet den Microsoft Naïve Bayes-Algorithmus.

Analysieren wichtiger Influencer (Tabellenanalysetools für Excel)

Mitarbeiter (Data Mining)

Der Zuordnungsassistent erstellt ein Zuordnungsmodell, das Zuordnungen zwischen Elementen erkennt, die in mehreren Transaktionen vorkommen, z. B. in der Marktkorbanalyse.

Assistent zum Zuordnen (Data Mining-Client für Excel)

Klassifizieren (Data Mining)

Der Assistent zum Klassifizieren erstellt ein Klassifizierungsmodell, das die Faktoren analysiert, die zu einem Zielergebnis beigetragen haben. Sie können mit diesem Assistenten mehrere Algorithmen verwenden, einschließlich Decision Trees, Naïve Bayes und Neural Networks.

Klassifizierungs-Assistent (Data Mining-Add-Ins für Excel)

Cluster (Datenanalyse)

Der Cluster-Assistent erstellt ein Clustermodell, das Gruppen von Zeilen erkennt, die ähnliche Merkmale aufweisen. Clustering (manchmal als Segmentierung bezeichnet) ist eine unbeaufsichtigte Lerntechnik, die sehr nützlich ist, wenn Sie versuchen, Muster und Gruppierungen in neuen Daten zu verstehen.

Der Microsoft Clustering-Algorithmus unterstützt mehrere Arten von K-Mittel- und Erwartungsmaximierung (EM)-Clustering.

Cluster-Assistent (Data Mining-Add-Ins für Excel)

Erkennen von Kategorien (Analysieren)

Mit dem Tool " Kategorien erkennen " können Sie einen beliebigen Datensatz hinzufügen und Clustering anwenden, um Nachgruppierungen von Daten zu finden. Es ist nützlich, Ähnlichkeiten zu finden und Gruppen zu erstellen, um sie weiter zu analysieren.

Das Tool " Kategorien erkennen" verwendet den Microsoft Clustering-Algorithmus.

Erkennen von Kategorien (Tabellenanalysetools für Excel)

Schätzung (Datenanalyse)

Der Schätzungs-Assistent erstellt ein Schätzungsmodell, das Datenmuster extrahiert und die Muster verwendet, um fortlaufende numerische, Datums- oder Uhrzeitwerte vorherzusagen. Er verwendet den Microsoft Decision Trees-Algorithmus.

Schätzungs-Assistent (Data Mining-Add-Ins für Excel)

Aus Beispiel füllen (Analysieren)

Mit dem Tool "Ausfüllen aus Beispiel" können Sie fehlende Werte ergänzen. Sie stellen einige Beispiele für die fehlenden Werte bereit, und das Tool erstellt Muster basierend auf allen Daten in der Tabelle und empfiehlt dann neue Werte basierend auf Mustern in den Daten.

Das Tool "Fill From Example" verwendet den Microsoft Logistic Regression-Algorithmus.

Füllung aus Beispiel (Tabellenanalysetools für Excel)

Prognose (Analysieren)

Das Prognosetool verwendet Daten, die sich im Laufe der Zeit ändern, und prognostiziert zukünftige Werte.

Das Prognosetool verwendet den Microsoft Time Series-Algorithmus.

Prognose (Tabellenanalysetools für Excel)

Prognose (Datenanalyse)

Der Prognose-Assistent erstellt ein Prognosemodell, das Muster in einer Reihe von Zellen erkennt und dann weitere Werte prognostiziert.

Prognose-Assistent (Data Mining-Add-Ins für Excel)

Hervorheben von Ausnahmen (Analysieren)

Das Tool "Ausnahmen hervorheben " analysiert Muster in einer Datentabelle und findet Zeilen und Werte, die nicht in das Muster passen. Anschließend können Sie sie überprüfen und korrigieren und das Modell erneut ausführen oder Werte für spätere Aktionen kennzeichnen.

Das Tool "Ausnahmen hervorheben " verwendet den Microsoft Clustering-Algorithmus.

Ausnahmen hervorheben (Tabellenanalysetools für Excel)

Vorhersagerechner (Analysieren)

Dieses Tool erstellt ein Modell, das die Faktoren analysiert, die zu Zielergebnissen führen, und dann ein Ergebnis für jede neue Eingabe prognostiziert, basierend auf Kriterien, die von diesen Mustern abgeleitet sind. Es generiert auch ein interaktives Entscheidungsfindungsarbeitsblatt, mit dem Sie problemlos neue Eingaben bewerten können. Sie können auch eine gedruckte Version des Bewertungsarbeitsblatts für die Offlineverwendung erstellen.

Das Tool "Vorhersagerechner " verwendet den Microsoft Logistic Regression-Algorithmus.

Vorhersagerechner (Tabellenanalysetools für Excel)

Szenario: Zielwertsuche (Analysieren)

Im Zielwertsuche-Tool geben Sie einen Zielwert an, und das Tool identifiziert die zugrunde liegenden Faktoren, die sich ändern müssen, um dieses Ziel zu erfüllen. Wenn Sie beispielsweise wissen, dass Sie die Anrufzufriedenheit um 20%erhöhen müssen, können Sie das Modell bitten, die Faktoren vorherzusagen, die sich ändern sollten, um dieses Ziel zu erreichen.

Das Zielwertsuche-Tool verwendet den Microsoft Logistic Regression-Algorithmus.

Details

Zielwertsuche-Szenario (Tabellenanalysetools für Excel)

Szenario: What-If Szenario (Analyse)

Das What-If Analyse-Tool ergänzt das Zielwertsuche-Tool. Mit diesem Tool haben Sie den Wert eingegeben, den Sie ändern möchten, und das Modell prognostiziert, ob diese Änderung ausreicht, um das gewünschte Ergebnis zu erzielen. Sie könnten beispielsweise das Modell fragen, ob das Hinzufügen eines zusätzlichen Anrufanbieters die Kundenzufriedenheit um einen Punkt erhöhen würde.

Das What-If-Tool verwendet den Microsoft Logistic Regression-Algorithmus.

What-If Szenario (Tabellenanalysetools für Excel)

Einkaufskorbanalyse (Analysieren)

Das Einkaufskorbanalysetool erstellt Gruppen von Produkten, die häufig zusammen gekauft werden, um Muster zu identifizieren, die bei Cross-Selling oder Up-Selling verwendet werden können. Außerdem werden Berichte basierend auf dem Preis und den Kosten der zugehörigen Produktbündel erstellt, um die Entscheidungsfindung zu unterstützen.

Sie können dieses Tool auch für Ereignisse verwenden, die häufig zusammen auftreten, Faktoren, die zu einer Diagnose führen, oder für andere mögliche Ursachen und Ergebnisse.

Das Einkaufskorbanalysetool verwendet den Microsoft Association-Algorithmus.

Einkaufskorbanalyse (Tabellenanalysetools für Excel)

Siehe auch

Untersuchen und Bereinigen von Daten
Validieren von Modellen und Verwenden von Modellen für Vorhersage (Data Mining-Add-Ins für Excel)
Bereitstellen und Skalieren von Miningmodellen (Data Mining-Add-Ins für Excel)