Power BI-forbrugsscenarier: Selvbetjent dataforberedelse

Bemærk

Denne artikel er en del af power BI-implementeringsplanlægningsserierne. I denne serie fokuseres der primært på Power BI-arbejdsbelastningen i Microsoft Fabric. Du kan få en introduktion til serien under Planlægning af implementering af Power BI.

Dataforberedelse (også kaldet ETL, som er et akronym for Extract, Transform og Load) involverer ofte en betydelig mængde arbejde, afhængigt af kvaliteten og strukturen af kildedataene. I brugsscenariet for selvbetjent dataforberedelse fokuseres der på, hvordan forretningsanalytikere kan genbruge dataforberedelsesaktiviteter. Det opnår dette mål om genbrug ved at flytte dataforberedelsesarbejdet fra Power Query (i individuelle Power BI Desktop-filer) til Power Query Online (ved hjælp af et Power BI-dataflow). Centraliseringen af logikken hjælper med at opnå en enkelt kilde til sandheden og reducerer den indsats, der kræves af andre indholdsoprettere.

Dataflow oprettes ved hjælp af Power Query Online i et af flere værktøjer: Power BI-tjeneste, Power Apps eller Dynamics 365 Customer Insights. Et dataflow, der er oprettet i Power BI, kaldes et analytisk dataflow. Dataflow, der er oprettet i Power Apps, kan enten være en af to typer: standard eller analyse. Dette scenarie dækker kun brug af et Power BI-dataflow, der er oprettet og administreret i Power BI-tjeneste.

Bemærk

Scenariet med selvbetjent dataforberedelse er et af BI-scenarierne med selvbetjening. Du kan se en komplet liste over selvbetjeningsscenarier i artiklen Power BI-forbrugsscenarier .

Nogle aspekter, der er beskrevet i emnet om indholdssamarbejde og leveringsscenarier , beskrives ikke kort i denne artikel. Du kan få fuld dækning ved at læse disse artikler først.

Scenariediagram

I følgende diagram vises en oversigt på højt niveau over de mest almindelige brugerhandlinger og Power BI-komponenter, der understøtter selvbetjent dataforberedelse. Det primære fokus er på at oprette et dataflow i Power Query Online, der bliver en datakilde for flere semantiske modeller (tidligere kaldet datasæt). Målet er, at mange semantiske modeller skal udnytte den dataforberedelse, der udføres én gang af dataflowet.

Diagram, der viser selvbetjent dataforberedelse, som handler om dataflow til centralisering af datarensning og transformationsarbejde. Elementerne i diagrammet er beskrevet i nedenstående tabel.

Tip

Vi opfordrer dig til at downloade scenariediagrammet , hvis du vil integrere det i din præsentation, dokumentation eller dit blogindlæg – eller udskrive det som en vægplakat. Da det er et SVG-billede (Scalable Vector Graphics), kan du skalere det op eller ned uden tab af kvalitet.

Scenariediagrammet viser følgende brugerhandlinger, værktøjer og funktioner:

Punkt Beskrivelse
Element 1. Opretteren af dataflowet udvikler en samling tabeller i et Power BI-dataflow. For et dataflow, der er beregnet til genbrug, er det almindeligt (men ikke påkrævet) for opretteren at tilhøre et centraliseret team, der understøtter brugere på tværs af organisatoriske grænser (f.eks. it, enterprise BI eller Center of Excellence).
Element 2. Dataflowet opretter forbindelse til data fra en eller flere datakilder.
Element 3. Nogle datakilder kan kræve en datagateway i det lokale miljø eller en VNet-gateway til opdatering af data, f.eks. dem, der er placeret i et privat organisationsnetværk. Disse gateways bruges både til at oprette dataflowet i Power Query Online, som er en webbaseret version af Power Query, og til at opdatere dataflowet.
Element 4. Dataflows er udviklet ved hjælp af Power Query Online. Den velkendte Power Query-grænseflade i Power Query Online gør overgangen fra Power BI Desktop enkel.
Element 5. Dataflowet gemmes som et element i et arbejdsområde, der er dedikeret til at gemme og beskytte dataflow. Der kræves en tidsplan for opdatering af dataflow for at holde dataene opdaterede (ikke afbildet i scenariediagrammet).
Element 6. Dataflowet kan genbruges som en datakilde af indholdsforfattere og af andre semantiske modeller, der kan være placeret i forskellige arbejdsområder.
Element 7. Den semantiske modelopretter udvikler en ny datamodel ved hjælp af Power BI Desktop. Den semantiske modelopretter kan bruge de fulde funktioner i Power Query i Power BI Desktop. De kan eventuelt anvende andre forespørgselstrin for yderligere at transformere dataflowdataene eller flette dataflowoutputtet.
Punkt 8. Når den semantiske modelopretter er klar, publicerer den Power BI Desktop-fil (.pbix), der indeholder datamodellen, til Power BI-tjeneste. Opdatering af den semantiske model administreres separat fra dataflowet (ikke afbildet i scenariediagrammet).
Element 9. Andre selvbetjente semantiske modeloprettere kan oprette nye datamodeller i Power BI Desktop ved hjælp af dataflowet som datakilde.
Element 10. På Administration-portalen kan Power BI-administratorer konfigurere Azure-forbindelser til at gemme dataflowdata på deres ADLS Gen2-konto (Azure Data Lake Storage Gen2). Indstillinger omfatter tildeling af en lagerkonto på lejerniveau og aktivering af lagertilladelser på arbejdsområdeniveau.
Element 11. Power BI-administratorer administrerer indstillinger på Administration-portalen.
Element 12. Dataflow gemmer som standard data ved hjælp af internt lager, der administreres af Power BI-tjeneste. Dataoutput fra dataflowet kan eventuelt gemmes på organisationens ADLS Gen2-konto . Denne type lager kaldes nogle gange medbring din egen datasø. En fordel ved at gemme dataflowdata i datasøen er, at den kan tilgås og forbruges af andre BI-værktøjer.
Element 13. Dataflowdata i ADLS Gen2 gemmes i en Power BI-specifik objektbeholder, der kaldes filsystem. I denne objektbeholder findes der en mappe for hvert arbejdsområde. Der oprettes en undermappe for hvert dataflow samt for hver tabel. Power BI genererer et snapshot, hver gang dataflowdataene opdateres. Snapshots beskriver sig selv og består af metadata og datafiler.
Element 14. Azure-administratorer administrerer tilladelser for organisationens ADLS Gen2-konto.
Element 15. Power BI-administratorer fører tilsyn med og overvåger aktivitet i Power BI-tjeneste.

Tip

Vi anbefaler, at du også gennemser scenariet for anvendelse af avanceret dataforberedelse . Den bygger på begreber, der introduceres i dette scenarie.

Vigtige punkter

Følgende er nogle vigtige punkter, der skal understreges i forbindelse med scenariet med selvbetjent dataforberedelse.

Dataflows

Et dataflow består af en samling tabeller (også kaldet enheder). Alt arbejde med at oprette et dataflow udføres i Power Query Online. Du kan oprette dataflow i flere produkter, herunder Power Apps, Dynamics 365 Customer Insights og Power BI.

Bemærk

Du kan ikke oprette dataflow i et personligt arbejdsområde i Power BI-tjeneste.

Understøttelse af semantiske modeloprettere

Scenariediagrammet viser, hvordan du bruger et Power BI-dataflow til at levere forberedte data til andre selvbetjente semantiske modeloprettere.

Bemærk

Semantisk model bruger dataflowet som datakilde. En rapport kan ikke oprette direkte forbindelse til et dataflow.

Her er nogle fordele ved at bruge Power BI-dataflow:

  • Semantiske modeloprettere bruger den samme velkendte Power Query-grænseflade, der findes i Power BI Desktop.
  • Dataforberedelse og datatransformationslogik, der er defineret af et dataflow, kan genbruges mange gange, fordi det er centraliseret.
  • Når dataforberedelseslogik ændres i dataflowet, kræver det muligvis ikke opdatering af afhængige datamodeller. Hvis du fjerner eller omdøber kolonner eller ændrer kolonnedatatyper, skal du opdatere afhængige datamodeller.
  • Forudforberedte data kan nemt gøres tilgængelige for power BI-semantiske modeloprettere. Genbrug er især nyttigt i forbindelse med ofte anvendte tabeller – især dimensionstabeller, f.eks. dato, kunde og produkt.
  • Det indsatsniveau, der kræves af semantiske modeloprettere, reduceres, fordi arbejdet med dataforberedelse er blevet afkoblet fra arbejdet med datamodellering.
  • Færre semantiske modeloprettere skal have direkte adgang til kildesystemer. Kildesystemer kan være komplekse at forespørge på og kan kræve specialiserede adgangstilladelser.
  • Antallet af opdateringer, der udføres på kildesystemer, reduceres, fordi semantiske modelopdateringer opretter forbindelse til dataflow og ikke til de kildesystemer, som dataflow udtrækker data fra.
  • Dataflowdata repræsenterer et snapshot i tiden og fremmer ensartethed, når de bruges af mange semantiske modeller.
  • Hvis dataforberedelseslogik afkobles i dataflow, kan det hjælpe med at forbedre en vellykket opdatering af semantisk model. Hvis en opdatering af dataflowet mislykkes, opdateres semantiske modeller ved hjælp af den seneste vellykkede opdatering af dataflowet.

Tip

Opret dataflowtabeller ved at anvende designprincipper for stjerneskemaer . Et stjerneskemadesign er velegnet til oprettelse af semantiske Power BI-modeller. Du kan også tilpasse dataflowoutputtet for at anvende brugervenlige navne og bruge bestemte datatyper. Disse teknikker fremmer konsistens i afhængige semantiske modeller og hjælper med at reducere mængden af arbejde, som semantiske modeloprettere skal udføre.

Fleksibilitet for semantiske modeloprettere

Når en semantisk modelopretter opretter forbindelse til et dataflow i Power BI Desktop, er forfatteren ikke begrænset til at bruge det nøjagtige dataflowoutput. De har stadig den fulde funktionalitet af Power Query tilgængelig for dem. Denne funktionalitet er nyttig, hvis der kræves yderligere arbejde med dataforberedelse, eller hvis dataene kræver yderligere transformation.

Avancerede funktioner i dataflow

Der er mange designteknikker, mønstre og bedste praksisser for dataflow, der kan tage dem fra selvbetjening til klar til virksomhed. Dataflow i et arbejdsområde, hvor licenstilstanden er angivet til Premium pr. bruger, Premium-kapacitet eller Fabric-kapacitet, kan drage fordel af avancerede funktioner.

Vigtigt

Denne artikel henviser til tider Power BI Premium eller dens kapacitetsabonnementer (P-SKU'er). Vær opmærksom på, at Microsoft i øjeblikket konsoliderer købsmuligheder og udfaser Power BI Premium pr. kapacitets-SKU'er. Nye og eksisterende kunder bør overveje at købe Fabric-kapacitetsabonnementer (F SKU'er) i stedet.

Du kan få flere oplysninger under Vigtige opdateringer, der kommer til Power BI Premium-licenser og Ofte stillede spørgsmål om Power BI Premium.

Bemærk

En af de avancerede funktioner er trinvis opdatering af dataflow. Selvom trinvis opdatering af semantiske modeller er en Power BI Pro-funktion, er trinvis opdatering af dataflow en Premium-funktion.

Du kan få mere at vide om avancerede funktioner for dataflow i scenariet for avanceret brug af dataforberedelse .

Opdatering af dataflow og semantisk model

Som tidligere nævnt er et dataflow en datakilde for semantiske modeller. I de fleste tilfælde er der flere tidsplaner for opdatering af data: én for dataflowet og én for hver semantisk model. Alternativt er det muligt at bruge DirectQuery fra den semantiske model til dataflowet, som er en Premium-funktion (ikke afbildet i scenariediagrammet).

Azure Data Lake Storage Gen2

I Microsoft Azure er en ADLS Gen2-konto en bestemt type Azure Storage-konto, hvor det hierarkiske navneområde er aktiveret. ADLS Gen2 har fordele i forbindelse med ydeevne, administration og sikkerhed i forbindelse med drift af analysearbejdsbelastninger. Power BI-dataflow bruger som standard internt lager, som er en indbygget data lake-konto, der administreres af Power BI-tjeneste. Organisationer kan eventuelt medbringe deres egne datasøer ved at oprette forbindelse til organisationens ADLS Gen2-konto.

Her er nogle fordele ved at bruge organisationens datasøkonto:

  • De data, der er gemt af et Power BI-dataflow, kan (eventuelt) tilgås fra datasøen af andre brugere eller processer. Det er nyttigt, når genbrug af dataflow sker ud over Power BI. Azure Data Factory kan f.eks. få adgang til dataene.
  • Dataene i datasøen kan (eventuelt) administreres af andre værktøjer eller systemer. I dette tilfælde kan Power BI bruge dataene i stedet for at administrere dem (ikke afbildet i scenariediagrammet).

Lager på lejerniveau

Afsnittet Azure-forbindelser på Administration-portalen indeholder en indstilling for at konfigurere en forbindelse til en ADLS Gen2-konto. Hvis du konfigurerer denne indstilling, kan du medbringe din egen datasø. Når du er konfigureret, kan du angive arbejdsområder til at bruge denne datasøkonto.

Vigtigt

Angivelse af Azure-forbindelser betyder ikke, at alle dataflow i Power BI-lejeren gemmes på denne konto som standard. Hvis du vil bruge en eksplicit lagerkonto (i stedet for internt lager), skal hvert arbejdsområde være specifikt forbundet.

Det er vigtigt at angive Azure-forbindelser for arbejdsområdet, før du opretter dataflow i arbejdsområdet. Den samme Azure Storage-konto bruges til semantiske Power BI-modelsikkerhedskopieringer.

Lager på arbejdsområdeniveau

En Power BI-administrator kan konfigurere en indstilling for at tillade lagertilladelser på arbejdsområdeniveau (i afsnittet Azure-forbindelser på Administration portalen). Når indstillingen er aktiveret, giver denne indstilling arbejdsområdeadministratorer mulighed for at bruge en anden lagerkonto end den, der er defineret på lejerniveau. Aktivering af denne indstilling er især nyttig for decentraliserede forretningsenheder, der administrerer deres egne datasøer i Azure.

Bemærk

Lagertilladelsen på arbejdsområdeniveau på Administration-portalen gælder for alle arbejdsområder i Power BI-lejeren.

Common Data Model-format

Dataene i en ADLS Gen2-konto gemmes i CDM-strukturen (Common Data Model). CDM-strukturen er et metadataformat, der bestemmer, hvordan det selvbeskrivende skema samt dataene gemmes. CDM-strukturen muliggør semantisk ensartethed i et format, der er standardiseret til deling af data på tværs af mange programmer (ikke afbildet i scenariediagrammet).

Publicer til separate arbejdsområder

Der er flere fordele ved at publicere et dataflow til et arbejdsområde , der er adskilt fra det, hvor de afhængige semantiske modeller gemmes. En fordel er klarhed over, hvem der er ansvarlig for at administrere, hvilke typer indhold (hvis du har forskellige personer, der håndterer forskellige ansvarsområder). En anden fordel er, at bestemte arbejdsområdetilladelser kan tildeles for hver type indhold.

Bemærk

Du kan ikke oprette dataflow i et personligt arbejdsområde i Power BI-tjeneste.

I det avancerede forbrugsscenarie for dataforberedelse beskrives det, hvordan du konfigurerer flere arbejdsområder for at give større fleksibilitet, når du understøtter oprettere af selvbetjening på virksomhedsniveau.

Konfiguration af gateway

Der kræves typisk en datagateway i det lokale miljø for at oprette forbindelse til datakilder, der er placeret i et privat organisationsnetværk eller et virtuelt netværk.

Der kræves en datagateway, når:

  • Oprettelse af et dataflow i Power Query Online, der opretter forbindelse til private organisationsdata.
  • Opdatering af et dataflow, der opretter forbindelse til private organisationsdata.

Tip

Dataflow kræver en central datagateway i standardtilstand. En gateway i personlig tilstand understøttes ikke, når du arbejder med dataflow.

Systemtilsyn

Aktivitetsloggen registrerer brugeraktiviteter, der forekommer i Power BI-tjeneste. Power BI-administratorer kan bruge de aktivitetslogdata, der indsamles, til at udføre overvågning for at hjælpe dem med at forstå forbrugsmønstre og indførelse. Aktivitetsloggen er også værdifuld til at understøtte styringstiltag, sikkerhedsrevisioner og krav til overholdelse af angivne standarder. Med et selvbetjent dataforberedelsesscenarie er det især nyttigt at spore brugen af dataflow.

I den næste artikel i serien kan du få mere at vide om brugsscenariet for avanceret dataforberedelse .