Data Mining-Client für Excel (SQL Server Data Mining-Add-Ins)

Der Data Mining-Client für Excel umfasst eine Reihe von Tools, mit denen Sie häufige Data Mining-Aufgaben ausführen können – von der Datenbereinigung bis hin zur Modellerstellung und Vorhersageabfragen. Sie können Daten in Excel-Tabellen oder Bereichen verwenden oder auf externe Datenquellen zugreifen.

DM

  • Arbeiten mit Daten

    Laden Sie die Daten in Excel, bereinigen Sie die Daten, suchen Sie nach Ausreißern, und erstellen Sie statistische Zusammenfassungen. Sie können auch verschiedene Arten von Stichproben ausführen, Datenprofile erstellen und Modelle mithilfe externer Daten testen. Mit dem Data Mining-Client können Sie Daten einfach ohne komplexe Skripts oder ETL-Prozesse für die Analyse vorbereiten.

  • Erstellen von Modellen und Analysieren

    Diese Tools bieten Assistentenschnittstellen zu bekannten, empirisch getesteten Data Mining-Algorithmen, einschließlich Clustering (K-Means und EM), Zuordnungsanalyse, Zeitreihenanalyse und Entscheidungsstrukturen. Durch erweiterte Modellierungsoptionen für jeden Assistenten können Sie verschiedene Algorithmen auswählen (wie Naive Bayes oder neuronale Netzwerke) und das Verhalten anpassen (wie Cluster-Ausgangswert oder ursprüngliche Stichprobengröße).

    Alle Data Mining-Algorithmen werden in einer instance von Analysis Services gehostet, sodass Sie mehr Möglichkeiten zum Erstellen komplexer Modelle erhalten.

  • Testen, Abfragen und Überprüfen von Modellen

    Der Data Mining-Client stellt Tools nach Industriestandard zum Testen von Modellen bereit, einschließlich Prognosegütediagramme und Kreuzvalidierung. Die Assistenten, die bereitgestellt werden, vereinfachen das Testen der Gültigkeit des Datasets und seiner Genauigkeit. Der Abfrage-Assistent erstellt Abfragen, um die Modelle für Vorhersagen und Bewertungen zu verwenden.

  • Anzeigen von Modellen

    Diagramme, die von den meisten Tools generiert werden, können direkt in Excel gespeichert werden. Verwenden Sie das Tool Durchsuchen von Modellen in Excel (SQL Server Data Mining-Add-Ins), um die Modelle zu untersuchen.

  • Verwalten, Dokumentieren und Bereitstellen

    Der Data Mining-Client für Excel verfügt über eine aktive Verbindung mit dem Server, sodass Sie das Data Mining-Modell auf dem Server speichern können, um es weiteren Tests zu unterziehen oder um es für größere Skalierbarkeit auf einem Produktionsserver bereitzustellen.

Arbeiten mit Daten

Die Gruppe Datenvorbereitung enthält die folgenden Assistenten, mit denen Sie Daten zur Vorbereitung auf Data Mining-Aufgaben überprüfen und sauber können. Darüber hinaus können Sie mit den meisten Assistenten Daten in Trainings- und Testsätze trennen.

Daten durchsuchen (SQL Server Data Mining-Add-Ins)
Zum Erstellen und Speichern von Modellen unterstützen die Add-Ins die folgenden Datenverbindungen:

  • Verbindung mit einem Analysis Services-Server zum Speichern und Verarbeiten der Modelle.

  • Optionale Verbindungen mit externen Datenquellen. Sie können Ihr Modell mithilfe eines beliebigen Datentyps erstellen, der als Analysis Services-Datenquelle definiert werden kann, oder einfach die bereits in Excel vorhandenen Daten verwenden.

Daten durchsuchen (SQL Server Data Mining-Add-Ins)
Der Assistent zum Durchsuchen von Daten hilft Ihnen, den Typ und die Menge der Daten in Ihrer Datentabelle zu verstehen, indem die Verteilung und die Werte für die ausgewählten Spalten einzeln dargestellt werden.

Beispieldaten (SQL Server Data Mining-Add-Ins)
Das Erstellen der richtigen Daten zum Trainieren und Testen Ihrer Modelle ist ein wichtiger Bestandteil beim Data Mining. Ohne die richtigen Tools kann diese Aufgabe jedoch mühsam sein. Der Assistent für Beispieldaten erleichtert das Unterteilen der für ein Modell verwendeten Daten in zwei Gruppen: eine zum Erstellen des Modells und eine zum Testen des Modells. Sie können zufällige Stichproben nehmen oder Überquotierung anwenden.

Vorhersagerechner (Tabellenanalysetools für Excel)
Der Assistent zum Entfernen von Ausreißern bietet Ihnen mehrere Tools, mit denen Sie Ausreißer identifizieren und angemessen behandeln können. Er zeigt die Verteilung der Werte sowie die Beziehung zwischen Ausreißern und anderen Daten auf. Sie können entscheiden, ob Ausreißer entfernt oder geändert werden sollen.

Vorhersagerechner (Tabellenanalysetools für Excel)
Mit dem Assistenten zum Erneuten Bezeichnen können Sie neue Bezeichnungen für Daten erstellen, um das Verständnis der Analyseergebnisse zu erleichtern. Beispielsweise können Sie einem Datenbereich einen aussagekräftigeren Namen geben oder einen repräsentativen Wert aus der Liste auswählen.

Erstellen von Modellen und Analysieren

Mit den Optionen im Abschnitt Datenmodellierung der Symbolleiste können Sie Muster aus Daten ableiten. Datenzeilen basierend auf Attributen gruppieren oder Zuordnungen untersuchen. Die Assistenten in diesem Toolmenüband basieren auf den leistungsstarken Data Mining-Algorithmen, die in Analysis Services verfügbar sind. Anders als mit den vergleichbaren Tabellenanalysetools für Excel können Sie mit diesen Assistenten das Verhalten der Algorithmen anpassen und eine Vielzahl von Datenquellen nutzen.

Assistent zum Klassifizieren (Data Mining-Add-Ins für Excel)
Der Klassifikations-Assistent unterstützt Sie beim Erstellen eines Klassifizierungsmodells, das auf vorhandenen Daten in einer Excel-Tabelle, einem Excel-Bereich oder einer externen Datenquelle basiert. Mit einem Klassifizierungsmodell werden Muster in den Daten extrahiert, die auf Übereinstimmungen hinweisen. So können Sie Vorhersagen basierend auf Wertgruppen treffen. Ein Klassifizierungsmodell kann beispielsweise verwendet werden, um das Risiko auf der Grundlage von Einkommens- und Konsummustern vorherzusagen.

Der Klassifikations-Assistent unterstützt die Verwendung dieser Microsoft Data Mining-Algorithmen: Decision Trees-Algorithmus, Logistische Regression, Naïve Bayes, neuronale Netzwerke.

Assistent zum Schätzen von Daten (Data Mining-Add-Ins für Excel)
Der Schätzungs-Assistent unterstützt Sie beim Erstellen eines Schätzmodells. Ein Schätzmodell extrahiert Datenmuster und verwendet diese, um ein numerisches Ergebnis (z. B. eine Währung, einen Umsatz, ein Datum oder eine Uhrzeit) vorherzusagen.

Der Schätzungs-Assistent verwendet die folgenden Microsoft Data Mining-Algorithmen: Entscheidungsstrukturen, lineare Regression, logistische Regression und Neuronale Netzwerke.

Wichtige Einflussfaktoren analysieren (Tabellenanalysetools für Excel)
Der Cluster-Assistent unterstützt Sie beim Erstellen eines Clusteringmodells. Ein Clustermodell erkennt Gruppen von Zeilen mit ähnlichen Merkmalen. Dieser Assistent ist hilfreich beim Durchsuchen von Mustern in sämtlichen Daten.

Der Cluster-Assistent verwendet den Microsoft Clustering-Algorithmus, der sowohl K-Means als auch EM umfasst.

Zuordnungs-Assistent (Data Mining-Client für Excel)
Der Assistent zum Zuordnen hilft Ihnen beim Erstellen eines Data Mining-Modells mithilfe des Microsoft Association Rules-Algorithmus, der häufig auftretende Elemente oder Ereignisse erkennt. Solche Zuordnungsmodelle sind besonders nützlich, wenn Sie Empfehlungen aussprechen möchten.

Der Assistent zum Zuordnen verwendet den Microsoft Association Rules-Algorithmus.

Planungs-Assistent (Data Mining-Add-Ins für Excel)
Der Prognose-Assistent unterstützt Sie bei der Vorhersage von Werten in einer Zeitreihe. In der Regel enthalten in einer Vorhersage verwendete Daten eine Art von Zeitreihen, entweder einen Datumsstempel oder eine Sequenz ID, anhand derer Muster für die Vorhersage künftiger Werte abgeleitet werden.

Der Prognose-Assistent verwendet den Microsoft Time Series-Algorithmus.

Erweiterte Modellierung (Data Mining-Add-Ins für Excel)
Sind Sie bereits vertraut mit dem Data Mining? Sie können die Erweiterten Datenmodellierungsoptionen verwenden, um benutzerdefinierte Datenstrukturen zu erstellen und Modelle mithilfe von Anpassungen zu erstellen, die nicht in den anderen Tools und Assistenten enthalten sind.

Testen, Abfragen und Überprüfen von Modellen

Verwenden Sie die Assistenten auf der Symbolleiste Genauigkeit und Validierung , um Branchenstandardtests zum Überprüfen der Genauigkeit Ihrer Modelle und zur Bewertung der Machbarkeit des Datasets zum Erstellen von Modellen zu verwenden.

Wichtige Einflussfaktoren analysieren (Tabellenanalysetools für Excel)
Bewertet die Leistung eines Data Mining-Modells durch Erstellen eines Liftdiagramms oder Punktdiagramms.

Klassifikationsmatrix (SQL Server Data Mining-Add-Ins)
Hilft beim Überprüfen der Leistung eines Klassifizierungsmodells durch Erstellen eines Diagramms, das genaue und ungenaue Vorhersagen des Modells zusammenfasst.

Gewinndiagramm (SQL Server Data Mining-Add-Ins)
Hilft beim Einschätzen der Auswirkungen eines Data Mining-Modells, indem die Genauigkeit der Vorhersagen zusammen mit den Kosten und Vorteilen der daraufhin erfolgenden Maßnahmen analysiert werden.

Kreuzvalidierung (SQL Server Data Mining-Add-Ins)
Erstellt einen Bericht, der die Genauigkeit des Modells über viele Teilmengen eines Datasets hinweg zusammenfasst, sodass Sie die Stabilität des Modells beurteilen können.

Sie können Daten in einer Excel-Tabelle auch in einer Vorhersageabfrage für ein Miningmodell verwenden, das auf dem Server gespeichert ist.

Abfrage (SQL Server Data Mining-Add-Ins)
Mit dem Abfrage-Assistenten können Sie Vorhersagen für ein vorhandenes Data Mining-Modell erstellen.

Erweiterter Data Mining-Abfrage-Editor
Für fortgeschrittene Benutzer bietet das Tool eine Drag & Drop-Schnittstelle zu DMX. Sie können auf einfache Weise Vorhersageabfragen oder neue Modelle erstellen, ohne dass Sie sich Gedanken über die Syntax machen müssen.

Anzeigen von Modellen

Modelle, die Sie erstellen, werden zum Durchsuchen automatisch geöffnet. Sie können Modelle trotzdem auch auf dem Server durchsuchen und neue Visualisierungen generieren. Verwenden Sie die Visio-Shapes , um Modelldiagramme in eine anpassbare Canvas zu exportieren.

Durchsuchen von Modellen in Excel (SQL Server Data Mining-Add-Ins)
Zeigen Sie die erstellten Modelle mit interaktiven Diagrammen an, die für jeden Modelltyp angepasst sind.

Dokumentieren von Miningmodellen (Data Mining-Add-Ins für Excel)
Dieser Assistent erstellt Berichte mit einer statistischen Zusammenfassung des Datasets und Metadaten zum Modell, die die Untersuchung und Interpretation erleichtern.

Verwalten, Dokumentieren und Bereitstellen

Mithilfe dieser Tools können Sie eine Verbindung mit einem Data Mining-Server herstellen. Zudem ermöglichen sie das Verwalten und Exportieren von Modellen sowie das Überwachen von Data Mining-Aktivitäten.

Modelle verwalten (SQL Server Data Mining-Add-Ins)
Wenn Sie über die erforderlichen Berechtigungen verfügen, können Sie vorhandene Miningmodelle und -strukturen löschen, ändern, umbenennen oder verarbeiten, ohne dazu Excel verlassen zu müssen.

Ablaufverfolgung (Data Mining-Client für Excel)
Klicken Sie auf Ablaufverfolgung, um eine fortlaufende Erfassung der Interaktion zwischen dem Excel-Client und dem SQL Server-Server anzuzeigen. Alle Aktivitäten werden als DMX- oder XMLA-Anweisungen gespeichert, sodass Sie Probleme in Ihrer Data Mining-Sitzung behandeln oder die Informationen zur späteren Verwendung speichern können.

Herstellen einer Verbindung mit einem Data Mining-Server
Um Excel als Client für Data Mining zu verwenden, müssen Sie eine Verbindung mit einer instance von Analysis Services herstellen. Die Verbindung bietet Ihnen Zugriff auf die Analysis Services-Engine. Mit den entsprechenden Berechtigungen lassen sich über die Verbindung alle entdeckten Muster speichern sowie vorhandene Data Mining-Objekte ändern.

Die Symbolleiste Verbindungen stellt Assistenten zum Verwalten von Verbindungen mit einer instance von Analysis Services bereit. Sie müssen eine Verbindung mit einem instance von Analysis Services definieren, um die Data Mining-Tools und -Algorithmen verwenden zu können. Sie können die Verbindung beim Installieren des Add-Ins erstellen oder später hinzufügen.

Erste Schritte
Klicken Sie auf die Schaltfläche Erste Schritte, um einen Konfigurations-Assistenten zu starten, der Sie durch die Erstellung einer Verbindung mit einer instance von Analysis Services und das Abrufen der erforderlichen Berechtigungen für Data Mining führt.

Hilfe
Das Dropdownmenü Hilfe enthält Links zu Onlinehilfe, Websites und einem Konfigurations-Assistenten, der Ihnen beim Einrichten und Starten von Data Mining hilft.

Die Hilfeseite bietet zudem Links zu Onlineressourcen (u. a. zur Hilfe für das Add-In) sowie zusätzliche Videos, Demos und Beispiele.

Weitere Informationen

Tabellenanalysetools für Excel
Problembehandlung für Data Mining-Diagramme in Visio (SQL Server Data Mining-Add-Ins)