Das Modell „Wird oft zusammen gekauft“ konfigurieren (Vorschauversion)
Wichtig
Einige oder alle dieser Funktionen sind als Teil einer Vorschauversion verfügbar. Inhalt und Funktionalität können sich ändern.
Nach der erfolgreichen Bereitstellung des „Wird oft zusammen gekauft“-Modells müssen Sie es konfigurieren, um Erkenntnisse zu den im Lakehouse verfügbaren Daten zu generieren.
Anforderungen
Sie benötigen die Berechtigung „Fabric-Administrierender (Arbeitsbereichsmitwirkender)“, um häufig zusammen gekaufte Produkte zu konfigurieren.
Konfigurieren Sie das Modell, um Erkenntnisse zu generieren
Das Notebook besteht aus den folgenden Zellen, die beschreiben, wie Daten verarbeitet werden, um die erforderliche Ausgabe bereitzustellen.
Vorsicht
Die folgenden Zellen werden in der empfohlenen Reihenfolge verwendet. Wenn sie in einer anderen Reihenfolge verwendet werden, schlägt das Notebook fehl.
Schritt 1. Bibliotheken importieren
In diesem Schritt werden die erforderlichen Bibliotheken für das Notebook importiert. In diesem Schritt müssen Sie keinerlei Änderungen vornehmen.
Schritt 2. Spark-Konfigurationen, Protokollierung und Checkpointer initialisieren
Dieser Schritt initialisiert die Spark-Konfigurationen, Protokollierungs- und Checkpointerobjekte, die für die Notebook-Ausführung verwendet werden.
Sie können die Protokollierung auf zweierlei Weise initialisieren:
Richten Sie sie so ein, dass Protokolle in die Ausgaben der Notebookzelle geschrieben werden. Dies ist die Standardeinstellung.
Richten Sie in einem Microsoft Azure Application Insights-Arbeitsbereich das Schreiben von Protokollen ein. Dafür benötigen Sie die Verbindungszeichenfolge des Application Insights-Arbeitsbereichs. Das System generiert eine Ausführungs-ID und zeigt sie dann in der Ausgabe der Zelle an. Sie können die Run-ID verwenden, um die Protokolle innerhalb des Application Insights-Bereichs abzufragen.
Sie können den Checkpointer verwenden, um die Spark-Implementierung zu synchronisieren und die Generierung doppelter Schlüssel zu vermeiden. Sie müssen einen Pfad angeben, den Sie als Arbeitsverzeichnis verwenden möchten. Der Name der Variable ist checkpoint_dir. Das Verzeichnis muss sich im Dateibereich des Lakehouse befinden, d. h. es muss mit „Files/“ beginnen.
Schritt 3. Eine Verbindung zu Lakehouse herstellen und die Eingabetabellen lesen
Dieser Schritt stellt eine Verbindung zum Lakehouse her und liest die Eingabetabellen, die für das Modell erforderlich sind. Sie können die Eingabetabellen auf eine der folgenden drei Arten lesen:
Das angeheftete Lakehouse des Notebooks, das die Beispieldaten enthält. Dies ist die Standardoption.
Lakehouses, die mit dem Notebook verbunden sind. Sie können das Lakehouse aus einem Dropdown-Menü auswählen.
Ein anderes Lakehouse, das nicht mit dem Notebook verbunden ist. Sie müssen den vollständigen Pfad zum Lakehouse angeben.
Einzelheiten zu Eingabetabellen finden Sie unter Eingabedaten für „Wird oft zusammen gekauft“.
Schritt 4. Analysezeiträume für das Modell festlegen
Mit dem Notebook können Sie das Modell über mehrere Zeiträume hinweg ausführen. Dies kann Ihnen dabei helfen, die Saisonalität und Veränderungen im Kundenverhalten, im Produktportfolio und in der Produktpositionierung im Zeitverlauf zu erfassen. Sie können die Ergebnisse verschiedener Zeiträume auch mit dem sofort einsatzbereiten Dashboard vergleichen.
Um einen Zeitraum festzulegen, verwenden Sie die Funktion add_analysis_period
. Legen Sie die Analysezeiträume unbedingt innerhalb der Dauer der Eingabedaten fest. Die Dauer der Eingabedaten (maximaler und minimaler Zeitstempel der Transaktionen) wird in der Ausgabe der Zelle protokolliert. Sie können bis zu fünf Zeiträume festlegen. Die Referenzschlüssel für die Zeiträume werden in der Tabelle TimePeriods gespeichert.
Schritt 5. Eingabedaten vorverarbeiten
Dieser Schritt verbindet die Eingabe-DataFrame, um ein POS-Dataset zu erstellen, welches das Modell zum Generieren der Erkenntnisse verwendet. In diesem Schritt müssen Sie keinerlei Änderungen vornehmen.
Die Ausgabe dieses Schritts umfasst die folgenden DataFrames:
purchases – Der POS-DateFrame purchases enthält Informationen zu den Einkäufen, die Kunden tätigen, wie etwa Einzelhandels-Entitäts-ID, Produkt-ID, Listenpreis des Produkts, Menge und Besuchszeitstempel. Sie können diesen DataFrame erstellen, indem Sie die Tabellen Visit, ShopperSession, ShopperSessionTransaction und TransactionLineItem verknüpfen.
time_periods – Dieser DataFrame enthält die Analysezeiträume, die Sie im vorherigen Schritt festgelegt haben. Sie können diese Zeiträume verwenden, um die Daten aufzuteilen und das Modell für jeden Zeitraum auszuführen.
retail_entities – Dieser DataFrame enthält die IDs der Einzelhandelsentitäten und ihre Informationen. Eine Einzelhandelsentität kann ein einzelnes Geschäft oder ein Einzelhändler sein. Sie können diese Entitäten verwenden, um das Modell auf Filial- oder Einzelhändlerebene auszuführen.
Schritt 6. Modellparameter festlegen und Modell ausführen
Zur Feinabstimmung der Modellergebnisse können die folgenden Modellparameter eingestellt werden:
Parametername: min_itemset_frequency
Beschreibung: Mindestanzahl der Käufe von Artikelsätzen (Sammlung von zwei zusammen gekauften Produkten), die bei der Analyse des Modells berücksichtigt werden sollen.
Wertetyp: Integer
Standardwert: 3
Erforderlich: wahr.
Zulässige Werte: >=1
Parametername: max_basket_size
Beschreibung: Maximale Anzahl an Artikeln in einem Warenkorb. Wenn die Anzahl der Artikel im Warenkorb den Standardwert überschreitet, wird der Warenkorb eingeschränkt. Das Produkt mit den niedrigsten Umsätzen im Dataset wird zuerst eingeschränkt.
Wertetyp: Integer
Standardwert: 20
Erforderlich: wahr.
Zulässige Werte: >=1
Parametername: chi_2_alpha
Beschreibung: Statistischer Signifikanzparameter. Wird verwendet, um zu bestimmen, ob ein einander zugeordnetes Produktpaar aussagekräftig und statistisch signifikant ist. Wenn die Punktzahl eines Produktpaars unter dem Parameterwert liegt, werden die Produkte im Feld „Chi2IsSignificant“ der Tabelle „RuleAttributes“ gekennzeichnet.
Wertetyp: Gleichkomma
Erforderlich: falsch
Standardwert: 0,05 Perzentil
Zulässiger Wertebereich: 0 bis 1
Bei der Ausführung werden Daten in die Ausgabetabellen geschrieben. Sie haben drei Möglichkeiten, um festzulegen, an welches Lakehouse geschrieben werden soll.
Schritt 7: Power BI-Dashboard-Tabellen erstellen
In diesem Schritt erstellen Sie Power BI-Dashboard-Tabellen. Ähnlich wie bei Eine Verbindung zum Lakehouse herstellen und den Eingabetabellenabschnitt lesen gibt es drei Methoden zum Schreiben von Ausgaben in Fabric.
Nachdem Sie die Power BI Dashboard-Tabellen erstellt haben, schreibt das System Daten in das Lakehouse. Weitere Informationen finden Sie unter Aufgabe von Datentabellen.
Schritt 8: Eine Ansicht ausschließlich mit „Ausgezeichnete Verbindung“ erstellen
„Ausgezeichnete Verbindung“ ist eine Klassifizierung, die auf eine starke und statistisch signifikante Beziehung zwischen den Produkten basierend auf den im SQL-Code festgelegten Kriterien schließen lässt. „Ausgezeichnete Verbindung“ leitet sich aus der Spalte StrengthOfAssociation ab, die basierend auf den Bedingungsanweisungen im SQL-Code ausgefüllt wird. Diese Logik kategorisiert die Stärke der Verbindung zwischen Produkten basierend auf den Werten der Spalten RuleQualityCategoryId und IsSignificant in der FBT-Tabelle.
„Ausgezeichnete Verbindung“ bezieht sich auf Fälle, in denen RuleQualityCategoryId 2 ist (was auf eine Assoziationsregel von hoher Qualität hinweist) und IsSignificant 1 ist (was darauf hinweist, dass die Verbindung statistisch signifikant ist).
Ist „IsSignificant“ 0, bedeutet dies, dass die Regelkategorie zwar als ausgezeichnet angesehen werden kann, die Signifikanz jedoch aufgrund unzureichender Daten eingeschränkt sein kann.
In diesem Schritt erstellen Sie eine Ansicht ausschließlich mit „Ausgezeichnete Verbindung“. Durch diesen Schritt werden die Produkte symmetrisch. Wenn Produkt1=A und Produkt2=B ist, müssen Sie im Wesentlichen einen symmetrischen Datensatz als Produkt1=B und Produkt2=A erstellen. Sie sollten A und B separat abfragen.
Schritt 9: Parameter von Power BI-Dashboard-Tabellen
Mit dem Parameter num_top_associated_products können Sie die Anzahl der am häufigsten verbundenen Produkte konfigurieren, die im Power BI Dashboard für jedes Produkt angezeigt werden sollen.
Beschreibung: – Maximale Anzahl zugeordneter Produkte für jedes Produkt, die im Power BI-Dashboard angezeigt werden soll. Gibt die ersten Produkte zurück, die im Feld Kombinationsrang in eine Reihenfolge gebracht sind.
Wertetyp – Integer
Erforderlich – falsch
Standardwert - 5
Zulässiger Wertebereich – 1 bis 10
Schritt 10: Ansichten erstellen
Aus den bisherigen Angaben können Sie Ansichten erstellen, in denen Sie Einkaufsbeträge und Mengen als Wochendurchschnitte berechnen.
Dieser Schritt repliziert für jedes Produktkriterium/jede Produktgruppe, die Sie separat anzeigen möchten, Daten. Sie können diesen Schritt abschließen, indem Sie jedem Geschäft/Einzelhändler, jedem Zeitraum und jeder Währung eine Rangfolge zuweisen.
Alle Artikel (im Falle von „Wird oft zusammen gekauft“ mit einem anderen Artikel)
10 höchste Umsätze aus Produktkombinationen (Hauptprodukte + häufig zusammen gekaufte Produkte)
10 niedrigste Umsätze aus Produktkombinationen (Hauptprodukte + häufig zusammen gekaufte Produkte)
Umsatzstärkster Hauptartikel
Umsatzschwächster Hauptartikel
Die Ansicht stellt die Hauptartikel (Produkt1) für jedes Geschäft/jeden Einzelhändler, jeden Zeitraum, jede Währung und jedes Produktkriterium mit dem wöchentlichen Umsatz, der Menge und der Summe des Umsatzes aller häufig zusammen gekauften Produkte dar.
Schritt 11: Eine Tabelle für das Power BI-Dashboard erstellen
Die Tabelle, die Sie in diesem letzten Schritt erstellen, kann direkt verwendet werden, ohne dass weitere Power BI-Kennzahlen oder berechnete Spalten erstellt werden müssen.
Je nach TableColProductGroupType gibt es drei Datensatztypen:
Type=1: TableColProductGroup="Group N" – Dieser Datensatz stellt den Hauptartikel dar, der Teil des Dashboard-Tabelle „Häufig zusammen gekauft“ ist.
Type=2: TableColProductGroup="Main product" - Dieser Datensatz stellt auch den Hauptartikel dar, der als anderer Datensatz Teil des Dashboard-Tabelle „Häufig zusammen gekauft“ ist.
Type=3: TableColProductGroup="FBT product" - Dieser Datensatz stellt den mit dem Hauptprodukt verbundenen Artikel dar.
Damit haben Sie die Datenbereinigung abgeschlossen und den Power BI-Bericht mit entsprechenden Filtern mithilfe des Notebooks erstellt. Sie diesen Bericht verwenden, um umsetzbare Erkenntnisse abzuleiten.