Konfigurowanie modelu Często kupowane razem (wersja zapoznawcza)

Ważne

Niektóre lub wszystkie te funkcje są dostępne w wersji zapoznawczej. Zawartość i funkcjonalność mogą ulec zmianie.

Po pomyślnym wdrożeniu często kupowanych razem należy:

  • Skonfiguruj uwierzytelnianie dla przykładowego klienta zestaw danych Contoso.

  • Skonfiguruj model w taki sposób, aby generuje szczegółowe informacje na temat danych dostępnych w domie.

Konfigurowanie przykładowego zestaw danych uwierzytelniania

Aby skonfigurować przykładowy adres firmy Contoso zestaw danych z uwierzytelnianiem, należy wykonać następujące kroki:

  1. Otwórz panel wdrożonych artefaktów i wybierz przykładowy adres firmy Contoso zestaw danych RDS_FBT_xxx_Dataset. Można wyświetlić szczegółowe informacje o zestaw danych, w tym raport, dane analiz SQL, punkt końcowy i Lakehouse. Wybierz opcję Plik/Ustawienia, aby przejrzeć ustawienia modelu analizy.

    Zrzut ekranu przedstawia przykładowy adres zestaw danych firmy Contoso.

  2. Wybierz kartę Modele semantyczne. W sekcji źródło danych poświadczeń jest alert o tym, że Nie można przetestować połączenia z tym źródłem danych. Spróbuj ponownie swoich poświadczeń. Wybierz opcję Edytuj poświadczenia.

    Na zrzutach ekranu jest źródło danych alertów o źródło danych poświadczeń.

  3. Pojawia się wyskakujące okno Jako metodę uwierzytelniania należy wybrać opcję OAuth2, wprowadzić opcjonalny poziom prywatności i wybrać opcję logowania, aby zalogować się przy użyciu tego uwierzytelniania.

    Zrzut ekranu przedstawiający sposób konfigurowania uwierzytelnienia zestawu danych.

Ważne

Jeśli przed skonfigurowaniem uwierzytelniania użytkownik spróbuje wyświetlić raport Często kupowane razem przed skonfigurowaniem uwierzytelniania dla serwera zestawu danych, w oknie raportu zostanie wyświetlony komunikat o błędzie, który stwierdza: „Wystąpił wyjątek z powodu problemu z usługą lokalną”.

Konfigurowanie modelu do generowania wglądu w dane

Notatnik składa się z następujących komórek, które opowiadają historię przetwarzania danych w celu zapewnienia wymaganych wyników.

Uwaga

Następujące komórki są używane w określonej zalecanej kolejności. Jeśli zostaną użyte w innej kolejności, notebook ulegnie awarii.

1. Importuj biblioteki

W tym kroku importowane są niezbędne biblioteki dla notesu. Nie masz żadnych zmian w tym kroku.

2. Zainicjuj konfiguracje Spark, rejestrator i punkt kontrolny

Ten krok inicjuje obiekty konfiguracji Spark, rejestratora i punktu kontrolnego, które są używane do wykonywania notesu.

Rejestrator można zainicjować na dwa różne sposoby:

  • Skonfiguruj zapisywanie dzienników w wynikach komórek notatnika. To jest zachowanie domyślne.

  • Skonfigurowany do zapisywania dzienników w obszarze roboczym Azure Application Insights, potrzebny będzie ciąg połączenia_ciągu obszaru roboczego Application Insights. Ponadto zostanie wygenerowany identyfikator uruchomienia, który zostanie wyświetlony w wynikach komórki i będzie można go używać do wysyłania zapytań do dzienników w obszarze roboczym Application Insights.

Checkpointer służy do synchronizowania wykonywania Spark i zapobiegania potencjalnemu generowaniu zduplikowanych kluczy. Należy podać ścieżkę używaną jako katalog roboczy. checkpoint_dir jest nazwą zmiennej. Katalog musi znajdować się w sekcji plików Lakehouse. Oznacza to, że musi zaczynać się od „Pliki/”.

3. Połącz się z Lakehouse i przeczytaj tabele wejściowe

Ten krok łączy się z Lakehouse i odczytuje tabele wejściowe wymagane dla modelu. Tabele wejściowe są odczytywane za pomocą jednej z trzech wymienionych opcji:

  • Przypięty Lakehouse notatnika, który zawiera przykładowe dane. Ta opcja jest domyślna.

  • Dowolne magazyny lakehouse podłączone do notesu. Możesz wybrać Lakehouse z menu rozwijanego.

  • Inny Lakehouse, który nie jest podłączony do notatnika. Musisz podać pełną ścieżkę do Lakehouse.

Aby uzyskać szczegółowe informacje na temat tabel wejściowych, zobacz Dane wejściowe dla często kupowanych razem.

Notatnik umożliwia uruchomienie modelu w wielu okresach czasu, co może pomóc w uchwyceniu sezonowości i zmian w zachowaniach klientów, portfolio produktów i pozycjonowaniu produktów w czasie. Możesz także porównać wyniki z różnych okresów, korzystając z gotowego pulpitu nawigacyjnego.

Aby zdefiniować okres czasu należy skorzystać z funkcji add_analysis_period. Pamiętaj, aby zdefiniować okresy analizy w ramach czasu trwania danych wejściowych. Czas trwania danych wejściowych (znacznik czasu transakcji maksymalnej i minimalnej) jest rejestrowany na wyjściu komórki. Można zdefiniować maksymalnie pięć okresów czasu. Klucze referencyjne dla okresów przechowywane są w tabeli TimePeriods.

4. Przetwarzaj wstępnie dane wejściowe

Ten krok łączy wejściowe ramki danych w celu utworzenia punktu sprzedaży zestaw danych, który jest używany przez model do generowania spostrzeżeń. Nie masz żadnych zmian w tym kroku.

Wynikiem tego kroku są następujące ramki danych:

  • purchases: ramka danych POS zakupów zawiera informacje o zakupach dokonanych przez klientów, takie jak identyfikator podmiotu detalicznego, identyfikator produktu, cena katalogowa produktów, ilość i sygnatura czasowa wizyty. Ta ramka danych jest tworzona poprzez połączenie tabel Visit, Order, Transaction i TransactionLineItem.

  • time_periods: Ta ramka danych zawiera okresy analizy zdefiniowane przez Ciebie w poprzednim kroku. Okresy te służą do podziału danych i uruchomienia modelu dla każdego okresu.

  • retail_entities: Ta ramka danych zawiera identyfikatory podmiotów detalicznych i ich informacje. Podmiotem detalicznym może być indywidualny sklep lub sprzedawca detaliczny. Podmioty te służą do uruchamiania modelu na poziomie sklepu lub sprzedawcy detalicznego.

5. Zdefiniować parametry modelu i wykonać model

Aby dostroić wyniki modelu, można ustawić następujące parametry modelu:

  • Nazwa parametru: min_itemset_frequency

    • Opis: Minimalna liczba zakupów zestawów pozycji (kolekcja dwóch produktów kupowanych razem) brana pod uwagę w analizie modelu.

    • Typ wartości: liczba całkowita

    • Wartość domyślna: 3

    • Wymagany: prawda.

    • Dozwolone wartości: >=1

  • Nazwa parametru: max_basket_size

    • Opis: Maksymalna liczba artykułów w jednym koszyku. Jeżeli ilość artykułów w koszyku przekracza wartość domyślną, koszyk zostaje przycięty. W pierwszej kolejności przycinany jest produkt z najniższą sprzedażą w zestaw danych.

    • Typ wartości: liczba całkowita

    • Wartość domyślna: 20

    • Wymagany: prawda.

    • Dozwolone wartości: >=1

  • Nazwa parametru: chi_2_alpha

    • Opis: Parametr istotności statystycznej. Służy do określenia, czy para powiązanych ze sobą produktów jest znacząca i istotna statystycznie. Jeśli para produktów uzyska wynik niższy niż wartość parametru, zostaną one oznaczone w polu Chi2IsSignificant w tabeli RuleAttributes.

    • Typ wartości: zmiennoprzecinkowa

    • Wymagany: fałsz

    • wartość domyślna 0.05 procenta

    • Dopuszczalny zakres wartości: 0-1

Po wykonaniu dane są zapisywane w tabelach wyjściowych. Masz trzy możliwości zdefiniowania, do którego Lakehouse chcesz pisać.

6. Tworzenie sformatowanych tabel Power BI

Parametr num_top_associated_products umożliwia Power BI skonfigurowanie liczby skojarzonych produktów, które mają być wyświetlane na pulpicie nawigacyjnym dla każdego produktu.

  • Opis: Maksymalna liczba powiązanych produktów dla każdego produktu, która ma być pokazana w pulpicie nawigacyjnym Power BI. Zwraca najlepsze produkty posortowane według pola CombinationRank

  • Typ wartości: liczba całkowita

  • Wymagany: fałsz

  • Wartość domyślna: 5

  • Dopuszczalny zakres wartości: 1-10

Po wykonaniu dane są zapisywane w Lakehouse. Aby uzyskać szczegółowe informacje na temat tabel wyjściowych, zobacz Dane wyjściowe dla często kupowanych razem.

Podobny do Połącz się z Lakehouse i przeczytaj sekcję z tabelami wejściowymi istnieją trzy metody zapisywania wyników w Fabric.