Del via


Implementere medaljongarkitektur med materialisert utsikt over innsjøen

Denne opplæringen beskriver trinnene og vurderingene for å implementere en medaljongarkitektur ved hjelp av materialisert utsikt over innsjøen. På slutten av denne opplæringen lærer du de viktigste funksjonene og funksjonene i materialiserte utsikter over innsjøen og kan opprette en automatisert arbeidsflyt for datatransformasjon. Denne opplæringen er ikke ment å være en referansearkitektur, en omfattende liste over funksjoner og funksjonalitet, eller en anbefaling av spesifikke anbefalte fremgangsmåter.

Forutsetninger

Som forutsetninger for denne opplæringen, gjør du følgende:

  1. Logg på Power BI-kontoen, eller hvis du ikke har en konto ennå, kan du registrere deg for en gratis prøveversjon.
  2. Aktiver Microsoft Fabric i leieren. Velg standard Power BI-ikon nederst til venstre på skjermen, og velg Stoff.
  3. Opprett et Microsoft Fabric-aktivert arbeidsområde.
  4. Velg et arbeidsområde fra Arbeidsområder-fanen, velg deretter + Nytt element, og velg Pipeline. Angi et navn for datasamlebåndet, og velg Opprett.
  5. Opprett et Lakehouse med skjemaer aktivert. Gi den navnet SalesLakehouse , og last inn eksempeldatafiler i Lakehouse. Hvis du vil ha mer informasjon, kan du se Opplæring i Lakehouse.

Oversikt over scenario

I denne opplæringen skal du ta et eksempel på en fiktiv detaljhandelsorganisasjon, Contoso, som bruker en medaljongarkitektur for dataanalyse for å få handlingsrettet innsikt i detaljhandelsvirksomheten. Det tar sikte på å effektivisere analyseprosessen og generere dypere innsikt i forretningsytelsen ved å organisere dataene i tre lag – bronse (rådata), sølv (renset og beriket data) og gull (aggregerte og analyserte data).

Diagrammet nedenfor representerer forskjellige enheter i hvert lag med medaljongarkitektur i SalesLakehouse:

Skjermbilde som viser medaljongarkitektur.

Enheter

  1. Ordrer: Denne enheten inneholder detaljer om hver kundeordre, for eksempel ordredato, forsendelsesdetaljer, produktkategori og underkategori. Innsikt kan trekkes for å optimalisere forsendelsesstrategier, identifisere populære produktkategorier og forbedre ordrestyringen.

  2. Salg: Ved å analysere salgsdata kan Contoso vurdere viktige måledata som total omsetning, fortjenestemarginer, ordreprioriteringer og rabatter. Korrelasjoner mellom disse faktorene gir en klarere forståelse av kundekjøpsatferd og effektiviteten av rabattstrategier.

  3. Plassering: Dette fanger opp den geografiske dimensjonen for salg og ordrer, inkludert byer, delstater, områder og kundesegmenter. Det hjelper Contoso med å identifisere områder med høy ytelse, håndtere områder med lav ytelse og tilpasse strategier for bestemte kundesegmenter.

  4. Agentytelse: Med detaljer om agenter som administrerer transaksjoner, provisjoner og salgsdata, kan Contoso evaluere individuell agentytelse, incentivize toppartister og utforme effektive provisjonsstrukturer.

  5. Agentprovisjoner: Inkorporering av provisjonsdata sikrer gjennomsiktighet og muliggjør bedre kostnadsstyring. Å forstå korrelasjonen mellom provisjonssatser og agentytelse bidrar til å begrense insentivsystemer.

Eksempeldatasett

Contoso opprettholder rådataene for detaljhandelsoperasjoner i CSV-format i ADLS Gen2. Vi bruker disse dataene til å opprette bronselaget, og deretter bruke bronselaget til å lage materialisert utsikt over innsjøen som danner sølv- og gulllagene i medaljongarkitekturen. Last først ned eksemplet på CSV-filer fra stoffeksemplets repo.

Opprett datasamlebåndet

Trinnene på høyt nivå er som følger:

  1. Bronselag: Innta rådata i form av CSV-filer inn i lakehouse.
  2. Silver Layer: Rens data ved hjelp av materialisert utsikt over innsjøen.
  3. Gold Layer: Kuratere data for analyse og rapportering ved hjelp av materialisert utsikt over innsjøen.

Opprett bronselag med arkitektur for salgsanalysemedaljong

  1. Last inn CSV-filene som tilsvarer forskjellige enheter, fra de nedlastede dataene til Lakehouse. Hvis du vil gjøre dette, navigerer du til lakehouse og laster opp de nedlastede dataene til Filer-delen av lakehouse. Det oppretter en mappe med navnet opplæring.

  2. Deretter oppretter du en snarvei til den fra Tabeller-inndelingen . Velg ... ved siden av Tabeller-delen , og velg Ny skjemasnarvei og deretter Microsoft OneLake. Velg SalesLakehouse fra datakildetypene. Utvid Filer-delen , og velg opplæringsmappen , og velg Opprett. Du kan også bruke andre alternative alternativer for å hente data inn i Lakehouse.

    Skjermbilde som viser hvordan du oppretter en snarvei for å hente dataene inn i tabeller.

  3. Gi opplæringsmappen et nytt navn fra Tabeller-delen som bronse.

    Skjermbilde som viser oppretting av bronselag.

Lag sølv- og gulllag med medaljongarkitektur

  1. Last opp den nedlastede notatblokkfilen til arbeidsområdet.

    Skjermbilde som viser oppretting av sølvmaterialet innsjøvisning.

  2. Åpne notatblokken fra Lakehouse. Hvis du vil ha mer informasjon, kan du se Utforske lakehouse-dataene med en notatblokk.

  3. Kjør alle cellene i notatblokken ved hjelp av Spark SQL for å opprette materialiserte innsjøvisninger med begrensninger for datakvalitet. Når alle cellene er utført, oppdaterer du SalesLakehouse-kilden for å vise den nyopprettede materialiserte utsikt over innsjøen for sølv - og gullskjema .

    Skjermbilde som viser kjør notatblokk.

Planlegg datasamlebåndet

  1. Når den materialiserte utsikten over innsjøen for sølv- og gulllag er opprettet, navigerer du til lakehouse og velger Forvaltet materialisert utsikt over innsjøen for å se avstammingsvisningen. Den er automatisk generert basert på avhengigheter, hver avhengig materialisert innsjøvisning danner nodene i avstammingen.

    Skjermbilde som viser materialisert innsjøvisning.

    Skjermbilde som viser opprettelse av avstamming.

  2. Velg Planlegg fra navigasjonsbåndet. Aktiver oppdateringen, og konfigurer tidsplanen.

    Skjermbilde som viser planlegging kjøre materialiserte lake visninger.

Overvåking og feilsøking

  1. Rullegardinmenyen viser gjeldende og historiske kjøringer.

    Skjermbilde som viser kjøring av planlegging.

  2. Ved å velge en av løypene, kan du finne de materialiserte detaljer om innsjøvisning på høyre sidepanel. Det nederste aktivitetspanelet gir en oversikt over nodekjøringsstatus på høyt nivå.

    Skjermbilde som viser utførelsesdetaljer.

  3. Velg en hvilken som helst node i avstammingen for å se nodekjøringsdetaljene og koble til detaljerte logger. Hvis nodestatusen mislyktes, vises også en feilmelding.

    Skjermbilde som viser kjøringsdetaljlogger.

  4. Hvis du velger koblingen Detaljerte logger, omdirigeres du til monitorhuben der du kan få tilgang til Spark-feillogger for ytterligere feilsøking.

    Skjermbilde som viser spark-logger.

  5. Velg rapportknappen for datakvalitet på båndet på siden for materialiserte innsjøvisninger for å opprette eller vise en rapport for automatisk generert datakvalitet.