Data Mining-Algorithmen (Analysis Services - Data Mining)

Artikel
07/30/2013

Ein Data Mining-Algorithmus besteht aus einer Reihe von Heuristiken und Berechnungen, durch die aus Daten ein Data Mining-Modell erstellt wird. Um ein Modell zu erstellen, werden vom Algorithmus zuerst die von Ihnen bereitgestellten Daten analysiert und bestimmte Muster oder Trends gesucht. Mithilfe der Ergebnisse dieser Analyse definiert der Algorithmus die optimalen Parameter zum Erstellen des Miningmodells. Diese Parameter werden dann für das gesamte Dataset übernommen, um aussagefähige Muster und ausführliche Statistiken zu extrahieren.

Das von einem Algorithmus aus Ihren Daten erstellte Miningmodell kann verschiedene Formen annehmen, einschließlich der folgenden:

Eine Reihe von Clustern, die die Beziehungen der Fälle in einem Dataset beschreiben.
Eine Entscheidungsstruktur, durch die ein Ergebnis vorhergesagt und beschrieben wird, wie sich unterschiedliche Kriterien auf dieses Ergebnis auswirken.
Ein mathematisches Modell zum Vorhersagen von Umsätzen.
Eine Gruppe von Regeln, die beschreiben, wie Produkte in einer Transaktion gruppiert werden, und die Wahrscheinlichkeiten, dass Produkte zusammen gekauft werden.

Microsoft SQL Server Analysis Services stellt mehrere Algorithmen bereit, die in den Data Mining-Projektmappen verwendet werden können. Diese Algorithmen stellen Implementierungen der bekanntesten im Data Mining verwendeten Methoden dar. Alle Data Mining-Algorithmen von Microsoft können angepasst und unter Verwendung der bereitgestellten APIs oder Data Mining-Komponenten in SQL Server Integration Services vollständig programmiert werden.

Sie können auch Algorithmen von Drittanbietern verwenden, die der Spezifikation von OLE DB für Data Mining entsprechen, oder benutzerdefinierte Algorithmen entwickeln, die als Dienste registriert und dann innerhalb des SQL Server Data Mining-Frameworks verwendet werden können.

Auswählen des richtigen Algorithmus

Es kann schwierig sein, den besten Algorithmus für einen bestimmten analytischen Task auszuwählen. Während verschiedene Algorithmen zum Ausführen derselben Geschäftsaufgabe verwendet werden können, liefert jeder Algorithmus ein anderes Ergebnis, und einige Algorithmen können mehr als eine Ergebnisart ergeben. Sie können z. B. den Microsoft Decision Trees-Algorithmus nicht nur für Vorhersagen verwenden, sondern auch als Möglichkeit, die Anzahl der Spalten in einem Dataset zu reduzieren, weil die Entscheidungsstruktur Spalten identifizieren kann, die sich nicht auf das endgültige Miningmodell auswirken.

Auswählen eines Algorithmus nach Typ

Analysis Services enthält die folgenden Algorithmentypen:

Klassifikationsalgorithmen sagen basierend auf den anderen Attributen im Dataset mindestens eine diskrete Variable voraus.
Regressionsalgorithmen sagen basierend auf anderen Attributen im Dataset mindestens eine kontinuierliche Variable voraus, z. B. den Gewinn oder Verlust.
Segmentierungsalgorithmen teilen Daten in Gruppen oder Cluster aus Elementen auf, die ähnliche Eigenschaften haben.
Zuordnungsalgorithmen suchen nach Korrelationen zwischen verschiedenen Attributen in einem Dataset. Die häufigste Anwendung dieser Algorithmusart besteht im Erstellen von Zuordnungsregeln, die für eine Warenkorbanalyse verwendet werden können.
Sequenzanalysealgorithmen fassen häufige Datensequenzen oder -periodizitäten, z. B. einen Webpfadfluss, zusammen.

Es gibt jedoch keinen Grund, sich in Projektmappen auf einen Algorithmus zu beschränken. Erfahrene Analytiker verwenden manchmal einen Algorithmus, um die effizientesten Eingaben (d. h. Variablen) zu bestimmen, und wenden dann einen anderen Algorithmus an, um ein bestimmtes Ergebnis auf Grundlage dieser Daten vorherzusagen. Mithilfe von SQL Server Data Mining können Sie mehrere Modelle für eine einzelne Miningstruktur erstellen. Daher können innerhalb einer einzelnen Data Mining-Projektmappe ein Clustering-Algorithmus, ein Entscheidungsstrukturmodell und ein Naïve Bayes-Modell verwendet werden, um unterschiedliche Sichten der Daten zu erhalten. Sie können mithilfe mehrerer Algorithmen in einer einzelnen Projektmappe auch separate Tasks ausführen: Beispielsweise können Sie mit dem Regressionsalgorithmus eine finanzielle Vorhersage generieren und mit dem Neural Network-Algorithmus die Faktoren analysieren, durch die der Umsatz beeinflusst wird.

Auswählen eines Algorithmus nach Task

Um Ihnen die Auswahl eines Algorithmus für einen bestimmten Task zu erleichtern, ist in der folgende Tabelle angegeben, für welche Tasktypen die einzelnen Algorithmen üblicherweise verwendet werden.

Beispiele für Tasks	Microsoft-Algorithmen
Vorhersagen eines diskreten Attributs Kennzeichnen von Kunden in einer Liste potenzieller Käufer als Kunden mit wahrscheinlicher oder unwahrscheinlicher Kaufabsicht. Berechnen der Wahrscheinlichkeit, dass ein Server innerhalb der nächsten sechs Monate ausfällt. Kategorisieren von Therapieergebnissen und Untersuchen verwandter Faktoren.	Microsoft Decision Trees-Algorithmus Microsoft Naive Bayes-Algorithmus Microsoft Clustering-Algorithmus Microsoft Neural Network-Algorithmus
Vorhersagen eines kontinuierlichen Attributs Vorhersagen des Verkaufstrends für das nächste Jahr. Vorhersagen von Websitebesuchern anhand historischer und saisonaler Trends. Generieren einer Risikobewertung anhand demografischer Daten.	Microsoft Decision Trees-Algorithmus Microsoft Time Series-Algorithmus Microsoft Linear Regression-Algorithmus
Vorhersagen einer Sequenz Ausführen einer Clickstreamanalyse für eine Unternehmenswebsite. Analysieren der Faktoren, die zu einem Serverausfall führen. Aufzeichnen und Analysieren von Arbeitsabläufen während ambulanter Arztbesuche, um Best Practices für allgemeine Abläufe aufzustellen.	Microsoft Sequence Clustering-Algorithmus
Suchen von Gruppen aus allgemeinen Elementen in Transaktionen Bestimmen der Produktplatzierung mithilfe der Warenkorbanalyse. Vorschlagen zusätzlicher Produktkäufe für einen Kunden. Analysieren einer Besucherumfrage zu einer Veranstaltung, um festzustellen, welche Aktivitäten oder Stände eine Korrelation aufweisen, und zukünftige Aktivitäten zu planen.	Microsoft Association-Algorithmus Microsoft Decision Trees-Algorithmus
Suchen von Gruppen mit ähnlichen Elementen Gruppieren von Patientenrisikoprofilen auf der Grundlage von Attributen wie demografischen oder Verhaltensdaten. Analysieren von Benutzern anhand von Browsing- und Kaufmustern. Identifizieren von Servern mit ähnlichen Verwendungsmerkmalen.	Microsoft Clustering-Algorithmus Microsoft Sequence Clustering-Algorithmus

Vorhersagen eines diskreten Attributs

Kennzeichnen von Kunden in einer Liste potenzieller Käufer als Kunden mit wahrscheinlicher oder unwahrscheinlicher Kaufabsicht.
Berechnen der Wahrscheinlichkeit, dass ein Server innerhalb der nächsten sechs Monate ausfällt.
Kategorisieren von Therapieergebnissen und Untersuchen verwandter Faktoren.

Microsoft Decision Trees-Algorithmus

Microsoft Naive Bayes-Algorithmus

Microsoft Clustering-Algorithmus

Microsoft Neural Network-Algorithmus

Vorhersagen eines kontinuierlichen Attributs

Vorhersagen des Verkaufstrends für das nächste Jahr.
Vorhersagen von Websitebesuchern anhand historischer und saisonaler Trends.
Generieren einer Risikobewertung anhand demografischer Daten.

Microsoft Decision Trees-Algorithmus

Microsoft Time Series-Algorithmus

Microsoft Linear Regression-Algorithmus

Vorhersagen einer Sequenz

Ausführen einer Clickstreamanalyse für eine Unternehmenswebsite.
Analysieren der Faktoren, die zu einem Serverausfall führen.
Aufzeichnen und Analysieren von Arbeitsabläufen während ambulanter Arztbesuche, um Best Practices für allgemeine Abläufe aufzustellen.

Microsoft Sequence Clustering-Algorithmus

Suchen von Gruppen aus allgemeinen Elementen in Transaktionen

Bestimmen der Produktplatzierung mithilfe der Warenkorbanalyse.
Vorschlagen zusätzlicher Produktkäufe für einen Kunden.
Analysieren einer Besucherumfrage zu einer Veranstaltung, um festzustellen, welche Aktivitäten oder Stände eine Korrelation aufweisen, und zukünftige Aktivitäten zu planen.

Microsoft Association-Algorithmus

Microsoft Decision Trees-Algorithmus

Suchen von Gruppen mit ähnlichen Elementen

Gruppieren von Patientenrisikoprofilen auf der Grundlage von Attributen wie demografischen oder Verhaltensdaten.
Analysieren von Benutzern anhand von Browsing- und Kaufmustern.
Identifizieren von Servern mit ähnlichen Verwendungsmerkmalen.

Microsoft Clustering-Algorithmus

Microsoft Sequence Clustering-Algorithmus

Verwandte Inhalte

Die folgende Tabelle enthält Links zu Schulungsressourcen für die einzelnen in Analysis Services bereitgestellten Data Mining-Algorithmen:

Grundlegende Algorithmusbeschreibung	Erläutert die Bedeutung und Funktionsweise des Algorithmus und zeigt mögliche Geschäftsszenarien auf, in denen der Algorithmus hilfreich sein könnte.
	Microsoft Association-Algorithmus Microsoft Clustering-Algorithmus Microsoft Decision Trees-Algorithmus Microsoft Linear Regression-Algorithmus Microsoft Logistic Regression-Algorithmus Microsoft Naive Bayes-Algorithmus Microsoft Neural Network-Algorithmus Microsoft Sequence Clustering-Algorithmus Microsoft Time Series-Algorithmus
Technische Referenz	Stellt technische Details zur Implementierung des Algorithmus ggf. mit Verweisen auf wissenschaftliche Artikel bereit. Listet die Parameter auf, die Sie festlegen können, um das Verhalten des Algorithmus zu steuern und die Ergebnisse im Modell anzupassen. Beschreibt Datenanforderungen sowie Leistungstipps, falls möglich.
	Technische Referenz für den Microsoft Association-Algorithmus Technische Referenz für den Microsoft Clustering-Algorithmus Technische Referenz für den Microsoft Decision Trees-Algorithmus Technische Referenz für den Microsoft Linear Regression-Algorithmus Technische Referenz für den Microsoft Logistic Regression-Algorithmus Technische Referenz für den Microsoft Naive Bayes-Algorithmus Technische Referenz für den Microsoft Neural Network-Algorithmus Technische Referenz für den Microsoft Sequence Clustering-Algorithmus Technische Referenz für den Microsoft Time Series-Algorithmus
Modellinhalt	Beschreibt die Strukturierung der Informationen innerhalb der einzelnen Data Mining-Modelltypen und erläutert, wie die in den einzelnen Knoten gespeicherten Informationen interpretiert werden.
	Miningmodellinhalt von Zuordnungsmodellen (Analysis Services – Data Mining) Mingingmodellinhalt von Clustermodellen (Analysis Services - Data Mining) Miningmodellinhalt von Entscheidungsstrukturmodellen (Analysis Services – Data Mining) Miningmodellinhalt von linearen Regressionsmodellen (Analysis Services – Data Mining) Miningmodellinhalt von logistischen Regressionsmodellen (Analysis Services – Data Mining) Miningmodellinhalt von Naive Bayes-Modellen (Analysis Services - Data Mining) Miningmodellinhalt von neuronalen Netzwerkmodellen (Analysis Services - Data Mining) Mingingmodellinhalt von Sequence Clustering-Modellen (Analysis Services – Data Mining) Miningmodellinhalt von Zeitreihenmodellen (Analysis Services – Data Mining)
Data Mining-Abfragen	Stellt mehrere Abfragen bereit, die mit jedem Modelltyp verwendet werden können. Zu den Beispielen gehören Inhaltsabfragen, die Aufschluss über die im Modell enthaltenen Muster geben, und Vorhersageabfragen, die Sie beim Generieren von Vorhersagen auf Grundlage dieser Muster unterstützen.
	Beispiele für Zuordnungsmodellabfragen Beispiele für Clusteringmodellabfragen Beispiele für Entscheidungsstruktur-Modellabfragen Beispiele für lineare Regressionsmodellabfrage Logistische Regressionsmodell-Abfragebeispiele Beispiele für Naive Bayes-Modellabfrage Neuronale Beispiele für Netzwerkmodellabfragen Sequenzclusteringmodellabfragebeispiele Abfragebeispiel Zeitreihenmodell

Thema	Beschreibung
Bestimmen des von einem Data Mining-Modell verwendeten Algorithmus	Abfragen der Parameter, mit denen ein Miningmodell erstellt wird
Erstellen eines benutzerdefinierten Plug-In-Algorithmus	Plug-In-Algorithmen
Durchsuchen eines Modells mit einem algorithmusspezifischen Viewer	Data Mining-Modell-Viewer
Anzeigen des Inhalts eines Modells unter Verwendung eines generischen Tabellenformats	Durchsuchen eines Modells mit dem Microsoft Generic Content Tree Viewer
Hier erfahren Sie, wie die Daten eingerichtet und Algorithmen zum Erstellen von Modellen verwendet werden	Miningstrukturen (Analysis Services - Data Mining) Miningmodelle (Analysis Services – Data Mining)

Siehe auch

Konzepte

Data Mining-Tools

Freigeben über

Data Mining-Algorithmen (Analysis Services - Data Mining)

Auswählen des richtigen Algorithmus

Auswählen eines Algorithmus nach Typ

Auswählen eines Algorithmus nach Task

Verwandte Inhalte

Verwandte Tasks

Siehe auch

Konzepte

Zusätzliche Ressourcen