Freigeben über


Zuordnungs-Assistent (Data Mining-Client für Excel)

Assistent zum Zuordnen im Data Mining-Menüband

Der Assistent zum Zuordnen hilft Ihnen beim Erstellen eines Data Mining-Modells mithilfe des Microsoft Association Rules-Algorithmus. Solche Miningmodelle sind besonders nützlich für die Erstellung von Empfehlungssystemen.

Die Funktionsweise besteht darin, dass der Microsoft Association Rules-Algorithmus ein Dataset aus Transaktionen oder Ereignissen scannt und die Kombinationen findet, die häufig zusammen angezeigt werden. Es kann Tausende Kombinationen geben. Der Algorithmus kann jedoch angepasst werden, um mehr oder weniger Kombinationen zu suchen und nur die wahrscheinlichsten Kombinationen beizubehalten.

Sie können die Zuordnungsanalyse bei vielen Problemen anwenden. Diese Methode wird vor allem für die Warenkorbanalyse verwendet, mit deren Hilfe einzelne Produkte gefunden werden, die oft zusammen gekauft werden. Anhand dieser Informationen können Sie dann Produkte auf der Basis von Produkten empfehlen, die die Kunden bereits gekauft haben.

Verwenden des Assistenten zum Zuordnen

  1. Klicken Sie im Data Mining-Menüband auf Zuordnen.

  2. Wählen Sie auf der Seite Quelldaten auswählen eine Excel-Tabelle oder einen Datenbereich aus, und klicken Sie auf Weiter.

    Die Beispieldatenarbeitsmappe enthält auf der Registerkarte Zuordnen ein Beispiel, wie Transaktionsdaten in der Regel angeordnet sind, wenn Sie beispielsweise in jeder Transaktion mehrere Produkte oder mehrere Einkaufsdatensätze pro Kunde analysieren möchten.

    Wenn Sie externe Daten verwenden möchten, um mithilfe des Assistenten zum Zuordnen eines Zuordnungsmodells zu erstellen, müssen Sie die Daten zuerst zu Excel hinzufügen und die Daten vereinfachen . Weitere Informationen zum Vorbereiten von Daten für die Zuordnungsmodellierung finden Sie unter Geschachtelte Tabellen (Analysis Services – Data Mining) in SQL Server-Onlinedokumentation.

  3. Wählen Sie auf der Seite Zuordnung die Spalte aus, die die Transaktion identifiziert.

    Bei Warenkorbmodellen stellt dieser Bezeichner die Einheit dar, die modelliert werden soll. Möchten Sie Artikel analysieren, die einzelne Kunden in einem bestimmten Zeitraum gekauft haben, oder möchten Sie viele Transaktionen mit mehreren Kunden analysieren? Im ersten Fall würden Sie die Kunden-ID auswählen, im letzten Fall würden Sie die Bestellung oder eine andere Transaktions-ID auswählen.

  4. Wählen Sie unter Element die Spalte aus, die die Elemente enthält, unter denen Sie Zuordnungen suchen müssen.

    Bei einem Warenkorbmodell würden Sie zum Beispiel ein Produktfeld auswählen, um zu analysieren, welche Produkte oft zusammen gekauft werden. Wenn zu viele einzelne Produkte für eine effiziente Korrelation vorhanden sind, könnten Sie ein Feld mit der Produktkategorie oder Unterkategorie auswählen.

  5. Unter Schwellenwerte können Sie Werte festlegen, die die Ausgabe des Modells steuern oder beeinflussen:

    • Minimale Unterstützung. Gibt an, wie häufig eine Gruppe von Artikeln erscheinen muss, um als wichtig betrachtet zu werden. Der Algorithmus ignoriert alle Artikelkombinationen, die dieses Kriterium nicht erfüllen. Beispielsweise könnten Sie nur die Itemsets anzeigen, in denen die Artikel mindestens 10-mal zusammen erschienen sind.

    • Minimale Regelwahrscheinlichkeit. Gibt den minimalen Wahrscheinlichkeitswert an, der erforderlich ist, damit eine Regel gespeichert wird. Das gesamte Dataset wird analysiert, um alle Kombinationen zu suchen. Anschließend wird die Wahrscheinlichkeit berechnet. Wird ein niedriger Schwellenwert festgelegt, werden vom Assistenten möglicherweise Elemente zugeordnet, die nur einen losen Zusammenhang aufweisen. Ist der festgelegte Schwellenwert zu hoch, werden bestimmte Zuordnungen möglicherweise ausgelassen, weil nicht genügend unterstützende Daten für sie vorhanden sind.

    Im Allgemeinen haben Änderungen dieser Werte folgende Auswirkungen:

    • Je niedriger Sie den Wert für die Unterstützung ansetzen, desto mehr Kombinationen werden gefunden.

    • Wenn Sie die maximale Unterstützung verringern, filtern Sie Elemente heraus, die so oft auftreten, dass sie nur von geringer Bedeutung sind.

    • Wenn Sie die Wahrscheinlichkeit einer Regel verringern, verringern Sie die Anforderungen, die eine Kombination erreichen muss, um im Kontext des gesamten Datasets als signifikant angesehen zu werden.

    Tipp: Es empfiehlt sich, mehrere Miningmodelle mit unterschiedlichen Kombinationen von Unterstützung und Wahrscheinlichkeit zu erstellen. Um nachzuverfolgen, welche Einstellungen Sie für jedes Modell verwendet haben, können Sie den Dokumentmodell-Assistenten verwenden, der im Data Mining-Client für Excel verfügbar ist, und die Option Detaillierter Bericht verwenden. Weitere Informationen finden Sie unter Dokumentieren von Miningmodellen (Data Mining-Add-Ins für Excel).

  6. Klicken Sie optional auf Parameter , um die Algorithmusparameter zu ändern und das Verhalten des Miningmodells anzupassen.

    Das Dialogfeld Algorithmusparameter enthält alle Parameter, die Sie im Assistenten festgelegt haben, und zusätzlich einige Parameter, die weniger häufig verwendet werden, z. B. MAXIMUM_SUPPORT. Informationen zur Verwendung dieser Parameter finden Sie in der technischen Referenz zu Microsoft Association Algorithm.

  7. Geben Sie auf der Seite Fertig stellen einen eindeutigen Namen für das Dataset und das Modell ein.

  8. Unter Optionen definieren Sie, wie Sie mit dem Modell arbeiten möchten, nachdem es abgeschlossen ist:

    • Durchsuchen. Wenn das Modell fertig ist, öffnet der Assistent ein Fenster, in dem die Regeln, die Itemsets sowie ein Abhängigkeitsnetzwerkdiagramm angezeigt werden, das die Zuordnungen darstellt.

      Weitere Informationen zum Interpretieren der Daten im Zuordnungsmodell-Viewer finden Sie unter Durchsuchen eines Zuordnungsregelnmodells.

    • Aktivieren Sie Drillthrough. Wählen Sie diese Option aus, um über das Modell Zugriff auf die zugrunde liegenden Daten zu erhalten.

      Ein Drillthrough ist zum Beispiel nützlich, wenn Sie auf ein bestimmtes Itemset klicken und die Quelldaten anzeigen möchten.

    • Verwenden Sie ein temporäres Modell. Wählen Sie diese Option aus, wenn das Modell nicht auf dem Server gespeichert werden soll. Temporäre Modelle werden beim Schließen von Excel gelöscht.

  9. Der Assistent analysiert alle möglichen Kombinationen und erstellt einen Bericht, der die Itemsets und Regeln enthält.

Weitere Informationen zu Zuordnungsmodellen

Der Microsoft Association Rules-Algorithmus untersucht die Trainingsdaten, um Elemente zu finden, die zusammen in einer Transaktion angezeigt werden. Jede Gruppe von Elementen stellt ein Itemset dar. Der Algorithmus zählt dann, wie häufig die einzelnen Itemsets auftreten, und berechnet die relative Bedeutung jedes Itemsets für alle Transaktionen.

Der Algorithmus verwendet diese Informationen zu Itemsets, um Regeln zu generieren, mit denen Zuordnungen vorhergesagt oder Empfehlungen abgegeben werden können. Eine Regel könnte beispielsweise wie folgt lauten: "Wenn der Benutzer ein Buch von Autor 1 und ein Buch von Autor 2 gekauft hat, wird er wahrscheinlich auch ein Buch von Autor 3 kaufen". Den Empfehlungen wird eine Wahrscheinlichkeit zugewiesen, die auf der Stärke der Zuordnungen basiert.

Anforderungen

Um den Assistenten zum Zuordnen verwenden zu können, müssen Sie mit einer Analysis Services-Datenbank verbunden sein.

Die Quelldaten müssen in einer Transaktionstabelle organisiert sein. Die Quelldaten müssen eine Spalte enthalten, in der die Transaktions-ID angegeben ist. Mit dieser Spalte werden die einzelnen Artikelgruppen identifiziert. Die Transaktionsspalte muss in einer 1:n-Beziehung mit einer zweiten Spalte (der Artikel-ID) stehen, in der die Namen oder ID-Nummern der einzelnen Artikel der Gruppe gespeichert sind.

Dieses Konzept ist wahrscheinlich am einfachsten mithilfe des Warenkorbbeispiels zu verstehen. Wenn dem Warenkorb eine ID zugeordnet ist, dient die Warenkorb-ID als Bezeichner für die Transaktion. Jeder Artikel im Warenkorb (z. B. Kartoffeln oder Milch) stellt ein Element dieser Transaktion dar. Der Algorithmus für die Zuordnung kann Artikel über Transaktionen hinweg nachverfolgen, um beispielsweise zu bestimmen, wie oft Kartoffeln und Milch innerhalb einer Transaktion vorkommen.

Ihre Quelldaten müssen nach der Spalte mit der Transaktions-ID sortiert sein.

Weitere Informationen

Erstellen eines Data Mining-Modells
Durchsuchen eines Association Rules-Modells
Warenkorbanalyse (Tabellenanalysetools für Excel)
Exemplarische Vorgehensweise für das Abhängigkeitsnetzwerkdiagramm (Data Mining-Add-Ins)