Konfigurowanie modelu Często kupowane razem (wersja zapoznawcza)

Artykuł
07/29/2024

Ważne

Niektóre lub wszystkie te funkcje są dostępne w wersji zapoznawczej. Zawartość i funkcjonalność mogą ulec zmianie.

Po pomyślnym wdrożeniu modułu Często kupowane razem trzeba skonfigurować model w celu generowania wiedzy o danych dostępnych w magazynie lakehouse.

Wymagania wstępne

Musisz mieć uprawnienie administratora Fabric (współautor obszaru roboczego) do konfiguracji razem często kupowanych razem.

Konfigurowanie modelu do generowania wglądu w dane

Notatnik składa się z następujących komórek, które opowiadają historię przetwarzania danych w celu zapewnienia wymaganych wyników.

Uwaga

Następujące komórki są używane w określonej zalecanej kolejności. Jeśli zostaną użyte w innej kolejności, notebook ulegnie awarii.

Krok 1. Importuj biblioteki

W tym kroku importowane są niezbędne biblioteki dla notesu. Nie masz żadnych zmian w tym kroku.

Krok 2. Zainicjuj konfiguracje Spark, rejestrator i punkt kontrolny

Ten krok inicjuje obiekty konfiguracji Spark, rejestratora i punktu kontrolnego, które są używane do wykonywania notesu.

Możesz inicjować program rejestrujący na dwa sposoby:

Skonfiguruj zapisywanie dzienników w wynikach komórek notatnika. To jest zachowanie domyślne.
Konfigurowanie zapisu dzienników do obszaru roboczego Microsoft Azure Application Insights. Do tego podejścia potrzebna jest connection_string obszaru roboczego Application Insights. System tworzy identyfikator uruchomienia, a następnie pokazuje go w danych wyjściowych komórki. Do zapytania dzienników w obszarze roboczym Application Insights można użyć identyfikatora uruchomienia.

Można użyć punktu kontrolnego do zsynchronizowania implementacji Spark oraz uniknięcia potencjalnej generowania zduplikowanych kluczy. Należy podać ścieżkę, która ma być używana jako katalog roboczy. Nazwą zmiennej jest checkpoint_dir. Katalog musi znajdować się w sekcji plików w magazynie lakehouse, czyli musi zaczynać się od „Files/”.

Krok 3. Połącz się z Lakehouse i przeczytaj tabele wejściowe

Ten krok łączy się z Lakehouse i odczytuje tabele wejściowe wymagane dla modelu. Tabele wejściowe można odczytać z jednej z następujących trzech opcji:

Przypięty Lakehouse notatnika, który zawiera przykładowe dane. Ta opcja jest domyślna.
Magazyny lakehouse, które są połączone z notesem. Z menu rozwijanego można wybrać magazyn lakehouse.
Inny Lakehouse, który nie jest podłączony do notatnika. Musisz podać pełną ścieżkę do Lakehouse.

Aby uzyskać szczegółowe informacje na temat tabel wejściowych, zobacz Dane wejściowe dla często kupowanych razem.

Krok 4. Definiowanie okresów analizy modelu

Notatnik umożliwia uruchomienie modelu w wielu okresach czasu, co może pomóc w uchwyceniu sezonowości i zmian w zachowaniach klientów, portfolio produktów i pozycjonowaniu produktów w czasie. Możesz także porównać wyniki z różnych okresów, korzystając z gotowego pulpitu nawigacyjnego.

Aby zdefiniować okres czasu należy skorzystać z funkcji add_analysis_period. Pamiętaj, aby zdefiniować okresy analizy w ramach czasu trwania danych wejściowych. Czas trwania danych wejściowych (znacznik czasu transakcji maksymalnej i minimalnej) jest rejestrowany na wyjściu komórki. Można zdefiniować maksymalnie pięć okresów czasu. Klucze referencyjne dla okresów przechowywane są w tabeli TimePeriods.

Krok 5. Przetwarzaj wstępnie dane wejściowe

Ten krok łączy wejściowe ramki danych w celu utworzenia punktu sprzedaży zestaw danych, który jest używany przez model do generowania spostrzeżeń. Nie masz żadnych zmian w tym kroku.

Dane wyjściowe tego kroku obejmują następujące elementy dataframe:

zakupy — element danych punktu sprzedaży zakupu zawiera informacje na temat zakupu przez klientów, takie jak identyfikator obiektu detalicznego, identyfikator produktu, kwota ceny cennika produktu, ilość oraz identyfikator czasu wizyty. Ten ramki danych można utworzyć, dołączając do tabel Odwiedź, ShopperSession, ShopperSessionTransaction i TransactionLineItem.
time_periods — ten ramki danych zawiera okresy analizy definiujące w poprzednim kroku. Tych okresów można używać do dzielenia danych i uruchamiania modelu dla każdego okresu.
retail_entities — Ta ramka danych zawiera identyfikatory podmiotów detalicznych i ich informacje. Obiektem detalicznym może być pojedynczy magazyn lub sprzedawca detaliczny. Tych encji można używać do uruchamiania modelu na poziomie magazynu lub na poziomie sprzedawców detalicznych.

Krok 6. Zdefiniuj parametry modelu i wykonać model

Aby dostroić wyniki modelu, można ustawić następujące parametry modelu:

Nazwa parametru: min_itemset_frequency
- Opis: Minimalna liczba zakupów zestawów pozycji (kolekcja dwóch produktów kupowanych razem) brana pod uwagę w analizie modelu.
- Typ wartości: liczba całkowita
- Wartość domyślna: 3
- Wymagany: prawda.
- Dozwolone wartości: >=1
Nazwa parametru: max_basket_size
- Opis: Maksymalna liczba artykułów w jednym koszyku. Jeżeli ilość artykułów w koszyku przekracza wartość domyślną, koszyk zostaje przycięty. W pierwszej kolejności przycinany jest produkt z najniższą sprzedażą w zestaw danych.
- Typ wartości: liczba całkowita
- Wartość domyślna: 20
- Wymagany: prawda.
- Dozwolone wartości: >=1
Nazwa parametru: chi_2_alpha
- Opis: Parametr istotności statystycznej. Służy do określenia, czy para powiązanych ze sobą produktów jest znacząca i istotna statystycznie. Jeśli para produktów uzyska wynik niższy niż wartość parametru, zostaną one oznaczone w polu Chi2IsSignificant w tabeli RuleAttributes.
- Typ wartości: zmiennoprzecinkowa
- Wymagany: fałsz
- wartość domyślna 0.05 procenta
- Dopuszczalny zakres wartości: 0-1

Po wykonaniu dane są zapisywane w tabelach wyjściowych. Masz trzy możliwości zdefiniowania, do którego Lakehouse chcesz pisać.

Krok 7: Tworzenie tabel pulpitów nawigacyjnych Power BI

W tym kroku należy utworzyć tabele pulpitu nawigacyjnego Power BI. Podobny do Połącz się z Lakehouse i przeczytaj sekcję z tabelami wejściowymi istnieją trzy metody zapisywania wyników w Fabric.

Po zakończeniu tworzenia tabel pulpitów nawigacyjnych Power BI system zapisuje dane w magazynie lakehouse. Aby uzyskać więcej szczegółów, zobacz artykuł dotyczący tabele danych wyjściowych

Krok 8: Tworzenie widoku tylko przy użyciu doskonałego skojarzenia

„Doskonałe skojarzenie” to klasyfikacja, która sugeruje silnym i istotnego z statystycznych relacji między produktami na podstawie kryteriów ustawionych w kodzie SQL. Doskonałe skojarzenie jest oparte na kolumnie StrengthOfAssoci, która jest wypełniana na podstawie instrukcji warunkowych w kodzie SQL. Ta logika skategoryzowała skojarzenie produktów na podstawie wartości kolumn RuleQualityCategoryId i IsSignificant z tabeli FBT.

„Doskonałe skojarzenie” odnosi się do spraw, w których RuleQualityCategoryId to 2 (co może oznaczać regułę skojarzenia o wysokiej jakości), a IsSignificant to 1 (co może wskazywać, że skojarzenie jest istotne w sposób statystyczny).

Jeśli IsSignificant jest 0, oznacza to, że kategoria reguły może być uważana za doskonałą, jednak mogą one być ograniczone z powodu braku wystarczających danych.

W tym kroku tworzysz widok tylko przy użyciu „doskonałego skojarzenia”. Ten krok powoduje, że produkty są symetryczne. W zasadzie, jeśli dla typu Produkt1=A i Produkt2=B konieczne jest utworzenie symetrycznego rekordu jako Produkt1=B i Produkt2=A. Należy zapytać o A i B oddzielnie.

Krok 9: Parametry tabelu pulpitu nawigacyjnego Power BI

Parametr num_top_associated_products umożliwia skonfigurowanie liczby skojarzonych produktów skojarzonych z najlepszymi produktami, które mają być wyświetlane na pulpicie nawigacyjnym Power BI dla każdego produktu.

Opis — Maksymalna liczba powiązanych produktów dla każdego produktu, która ma być pokazana w pulpicie nawigacyjnym Power BI. Zwraca pierwsze produkty sortowane w polu Klasyfikacja kombinacji.
Typ wartości — liczba całkowita
Wymagany — fałsz
Wartość domyślna — 5
Dopuszczalny zakres wartości — 1-10

Krok 10: Tworzenie widoków

Widoki można utworzyć na podstawie poprzednich informacji, w których kwoty zakupu i ilości są obliczane jako średnie tygodniowe.

Ten krok umożliwia replikowanie danych dla poszczególnych kryteriów/grup produktów, które mają zostać wyświetlić oddzielnie. Ten krok można zakończyć, korzystając z klasyfikacji poszczególnych magazynów/sprzedawców detalicznych, okresu i waluty.

Wszystkie elementy (jeśli często nie można chować się razem z innym elementem)
10 najwyższych wartości często zgłaszanych razem przychodów (główne + Często spotykane razem)
10 najniższych wartości często zgłaszanych razem przychodów (główne + Często spotykane razem)
Najlepsze sprzedawcy w przychodach z pozycji głównej
Najniżsi sprzedawcy w przychodach z pozycji głównej

Widok przedstawia główne elementy (Produkt1) dla każdego magazynu/sprzedawcy, okresu, waluty i kryteriów produktu wraz z jego tygodniowym przychodem, ilością i sumą często spotykanych przychodów produktów.

Krok 11: Tworzenie tabeli, która zużywa pulpit nawigacyjny Power BI

Tabela utworzyć w tym ostatnim kroku jest bezpośrednio indyjna bez konieczności tworzenia innych miar Power BI ani kolumn obliczanych.

Według typu TableColProductGroupType istnieją trzy typy rekordów:

Typ=1: TableColProductGroup="Grupa N" — ten rekord reprezentuje element główny, który jest częścią tabeli pulpitu nawigacyjnego często odwiedzanych razem.
Typ=2: TableColProductGroup="Główny produkt" — ten rekord także reprezentuje element główny, który jest częścią tabeli pulpitu nawigacyjnego często odwiedzanych razem jako inny rekord.
Typ=3: TableColProductGroup="Produkt FBT" — ten rekord reprezentuje element skojarzony z produktem głównym.

Po zakończeniu oczyszczania danych i utworzeniu raportu Power BI z zastosowaniem odpowiednich filtrów przy użyciu odpowiednich filtrów. Można go użyć do uzyskania wglądu w dane, które można wykorzystać do działania.

Udostępnij za pośrednictwem