Konfigurere Ofte købt sammen-model (forhåndsversion)
Vigtigt!
Nogle eller alle af disse funktioner, der er angivet i dette emne, er tilgængelige som del af en forhåndsversion. Indholdet og funktionerne kan ændres.
Når du har udrullet ofte købt sammen, kan du konfigurere modellen til at generere indsigt i de tilgængelige data i søhus.
Forudsætninger
Du skal have tilladelsen Fabric-administrator (Arbejdsområde til bidragsyder) til at konfigurere Ofte købt sammen.
Konfigurer model til at generere indsigt
Notesbogen består af følgende celler, der fortæller historien om, hvordan data behandles for at give det nødvendige output.
Advarsel
Følgende celler bruges i den anbefalede sekvens. Hvis de bruges i en anden rækkefølge, fejler den bærbare computer.
Trin 1. Importer biblioteker
Dette trin importerer de nødvendige biblioteker til Notebook. Du behøver ikke foretage ændringer i dette trin.
Trin 2. Initialiser Spark-konfigurationer, logfiler og checkpointer
Dette trin initialiserer gnistkonfigurationer, logfiler- og checkpointer-objekter, der bruges til notebook-udførelsen.
Du kan initialisere log-funktionen på to forskellige måder:
Indstil til at skrive logfiler til notebook-celleudgangene. Denne adfærd er standarden.
Konfigurere til at skrive logs til et Microsoft Azure Application Insights arbejdsområde. Til denne fremgangsmåde skal du connection_string af arbejdsområdet Application Insights. Systemet opretter et Run ID og viser det derefter i cellens output. Du kan bruge kørsels-id'et til at forespørge om logge i arbejdsområdet Application Insights .
Du kan bruge checkpointer til at synkronisere implementeringen af Spark og undgå potentiel oprettelse af duplikerede nøgler. Du skal angive en sti, du vil bruge som arbejdsmappe. Navnet på variablen er checkpoint_dir. Mappen skal være inden for filsektionen i de Lakehouse, dvs. at den skal starte med "Filer/".
Trin 3. Tilslut til Lakehouse, og læs inputtabeller
Dette trin forbinder til Lakehouse og læser de inputtabeller, der kræves til modellen. Du kan læse inputtabellerne fra en af følgende tre muligheder:
Det fastgjorte Lakehouse på notesbogen, som indeholder eksempeldataene. Denne indstilling er standarden.
Lakehouse, der er forbundet med notebook. Du kan vælge et Lakehouse på en rulleliste.
En anden Lakehouse, der ikke er forbundet til notesbogen. Du skal give den fulde vej til Lakehouse.
For detaljer om inputtabeller, se Inputdata for Ofte købt sammen.
Trin 4. Definer analyseperioder for modellen
Notesbogen giver dig mulighed for at køre modellen på flere tidsperioder, hvilket kan hjælpe dig med at fange sæsonbestemte og ændringer i kundeadfærd, produktportefølje og produktpositionering over tid. Du kan også sammenligne resultaterne af forskellige tidsperioder ved hjælp af out-of-the-box dashboardet.
Du kan definere en tidsperiode ved at bruge add_analysis_period
-funktionen. Sørg for at definere analyseperioderne inden for varigheden af inputdataene. Varigheden af inputdataene (maks. og min. transaktionstidsstempel) logges i cellens output. Du kan definere op til fem tidsperioder. Referencenøglerne for perioderne er gemt i Tidsperioder tabellen.
Trin 5. Forbehandle inputdata
Dette trin forbinder inputdatarammerne for at skabe en POS datasæt, som bruges af modellen til at generere indsigten. Du behøver ikke foretage ændringer i dette trin.
Outputtet fra dette trin omfatter følgende dataframes:
køb - Købene POS-dataframe indeholder oplysninger om de indkøb, som kunder foretager, f.eks. detailobjekt-id, produkt-id, prisbeløb på produktliste, antal og besøgstidsstempel . Du kan oprette denne dataframe ved at oprette forbindelse til tabellerne Visit, ShopperSession, ShopperSessionTransaction og TransactionLineItem.
time_periods - Denne dataframe indeholder de analyseperioder, du definerer i forrige trin. Du kan bruge disse perioder til at opdele dataene og køre modellen i hver periode.
retail_entities - Denne dataframe indeholder detailenheds-id'er og deres oplysninger. Et detailobjekt kan være et individuelt lager eller en detailvirksomhed. Du kan bruge disse objekter til at køre modellen på et lagerniveau eller detailniveau.
Trin 6. Definer modelparametre og udfør model
Følgende modelparametre kan indstilles til at finjustere modelresultaterne:
Parameternavn: min_itemset_frequency
Beskrivelse: Minimale antal køb af varesæt (samling af to produkter købt sammen), der skal tages i betragtning ved analysen af modellen.
Værditype: heltal
Standardværdi: 3
Påkrævet: sandt.
Tilladte værdier: >=1
Parameternavn: max_basket_size
Beskrivelse: Maksimalt antal varer i en kurv. Hvis antallet af varer i kurven overstiger standardværdien, trimmes kurven. Produktet med det laveste salg i datasæt trimmes først.
Værditype: heltal
Standardværdi: 20
Påkrævet: sandt.
Tilladte værdier: >=1
Parameter name: chi_2_alpha
Beskrivelse: Statistisk signifikansparameter. Bruges til at bestemme, om et par produkter, der er forbundet sammen, er meningsfuldt og statistisk signifikant. Hvis et par produkter scorer mindre end parameterværdien, markeres de i feltet Chi2IsSignificant i RuleAttributes-tabellen.
Værditype: flydende
Påkrævet: falsk
Standardværdi: 0,05 percentil
Tilladte værdier: 0-1
Ved udførelse skrives data til outputtabellerne. Du har tre muligheder for at definere, hvilket Lakehouse du skal skrive til.
Trin 7: Opret Power BI-dashboard-tabeller
I dette trin opretter du dashboard-tabeller Power BI. Svarende til Opret forbindelse til Lakehouse, og læs afsnittet med inputtabeller, er der tre metoder til at skrive output til Fabric.
Når du er færdig med at oprette Power BI-dashboard-tabeller, skriver systemet data til Lakehouse. Du kan finde flere oplysninger i Output-datatabeller
Trin 8: Opret kun en visning med 'Fremragende tilknytning'
'Fremragende tilknytning' er en klassificering, der indikerer en stærk og statistisk vigtig relation mellem produkterne baseret på de kriterier, der er angivet i SQL-koden. 'Fremragende tilknytning' er afledt af kolonnen StrengthOfAssociation, der udfyldes på baggrund af betingede sætninger i SQL-koden. Denne logik kategoriserer tilknytningsstyrken mellem produkter baseret på værdierne i kolonnerne RuleQualityCategoryId og IsSignificant i FBT-tabellen.
'Fremragende tilknytning' henviser til de tilfælde, hvor RuleQualityCategoryId er 2 (hvilket kan betyde en tilknytningsregel af høj kvalitet), og IsSignificant er 1 (hvilket kan indikere, at tilknytningen er statistisk vigtig).
Hvis IsSignificant er 0, betyder det, at selvom regelkategorien kan opfattes som fremragende, kan problemet være begrænset, fordi der ikke er tilstrækkelige data.
I dette trin kan du kun oprette en visning med 'Fremragende tilknytning'. Dette trin gør produkterne symmetriske. Hvis Product1=A og Product2=B anvendes, skal du oprette en symmetrisk post som Product1=B og Product2=A. Du skal forespørge A og B separat.
Trin 9: Power BI dashboard-tabelparametre
Du kan bruge parameteren num_top_associated_products til at konfigurere antallet af tilknyttede topprodukter, der skal vises på Power BI dashboardet for hvert produkt.
Beskrivelse: - Maksimalt antal tilknyttede produkter for hvert produkt, der skal vises i Power BI-dashboard. Returnerer de øverste produkter, som sorteres i feltet Kombinationsplacering.
Værditype: - heltal
Påkrævet: - falsk
Standardværdi - 5
Tilladt værdiområde - 1-10
Trin 10: Opret visninger
Du kan oprette visninger ud fra de tidligere oplysninger, hvor du beregner købsbeløb og antal som ugentlige gennemsnit.
I dette trin replikeres data for de enkelte produktkriterier/grupper, du vil have vist separat. Du kan fuldføre dette trin ved at rangordning af hver enkelt butik/forhandler, tidsperiode og valuta.
Alle elementer (hvis Ofte anvendes sammen med et andet element)
10 højeste Ofte anvendes samlet omsætning (hoved + ofte sammen)
10 laveste Ofte anvendes samlet omsætning (hoved + ofte sammen)
Bedste sælger i hovedelementomsætning
Laveste sælger i hovedelementomsætning
Visningen repræsenterer hovedelementer (Produkt1) for de enkelte lagre/detailhandlere, tidsperioder, valutaer og produktkriterier med den ugentlige omsætning, det ugentlige antal og summen af alle produkters omsætning.
Trin 11: Oprettelse af en tabel, som Power BI dashboardet forbruger
Den tabel, du opretter i dette sidste trin, kan bruges direkte, uden at det er nødvendigt at oprette andre Power BI-mål eller beregnede kolonner.
Der findes tre typer poster i henhold til TableProductGroupType:
Type=1: TableProductGroup="Gruppe N" - Denne post repræsenterer det primære element, som er en del af dashboardtabellen ofte sammen.
Type=2: TableProductGroup="Hovedprodukt" - Denne post repræsenterer også det primære element, som er en del af dashboardtabellen ofte sammen som en anden post.
Type=3: TableColProductGroup="FBT-produkt" - Denne post repræsenterer det tilknyttede element til hovedproduktet.
Nu er du færdig med at rydde op i data, og du har oprettet rapporten Power BI med de relevante filtre ved hjælp af filtrene. Du kan også bruge denne rapport til at aflede handlingsrettede indsigter.