Hvad er dataflow?

Tip

Prøv Dataflow Gen2 i Data Factory i Microsoft Fabric, som er en alt-i-en-analyseløsning til virksomheder. Microsoft Fabric dækker alt lige fra dataflytning til datavidenskab, analyse i realtid, business intelligence og rapportering. Få mere at vide om, hvordan du starter en ny prøveversion gratis!

Dataflow er en selvbetjent, cloudbaseret teknologi til dataforberedelse. Dataflow giver kunderne mulighed for at indtage, transformere og indlæse data i Microsoft Dataverse-miljøer, Power BI-arbejdsområder eller din organisations Azure Data Lake Storage-konto. Dataflow oprettes ved hjælp af Power Query, som er en samlet dataforbindelses- og forberedelsesoplevelse, der allerede findes i mange Microsoft-produkter, herunder Excel og Power BI. Kunder kan udløse dataflow for at køre enten efter behov eller automatisk efter en tidsplan. data holdes altid opdateret.

Dataflow kan oprettes i flere Microsoft-produkter

Dataflow er udvalgt i flere Microsoft-produkter og kræver ikke, at der oprettes eller køres en dataflowspecifik licens. Dataflow er tilgængelige i Power Apps, Power BI og Dynamics 365 Customer Insights. Muligheden for at oprette og køre dataflow er bundtet med disse produkters licenser. Dataflowfunktioner er mest almindelige på tværs af alle de produkter, de er fremhævet i, men nogle produktspecifikke funktioner kan findes i dataflow, der er oprettet i ét produkt i forhold til et andet.

Hvordan fungerer dataflowet?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

Det forrige billede viser en overordnet visning af, hvordan et dataflow er defineret. Et dataflow henter data fra forskellige datakilder (mere end 80 datakilder understøttes allerede). På baggrund af de transformationer, der er konfigureret med Power Query-oprettelsesoplevelsen, transformerer dataflowet derefter dataene ved hjælp af dataflowprogrammet. Endelig indlæses dataene til outputdestinationen, som kan være et Microsoft Power Platform-miljø, et Power BI-arbejdsområde eller organisationens Azure Data Lake Storage-konto.

Dataflow kører i cloudmiljøet

Dataflow er cloudbaserede. Når et dataflow oprettes og gemmes, gemmes definitionen i cloudmiljøet. Et dataflow kører også i cloudmiljøet. Men hvis en datakilde er i det lokale miljø, kan en datagateway i det lokale miljø bruges til at udtrække dataene til cloudmiljøet. Når en kørsel af dataflow udløses, sker datatransformationen og beregningen i cloudmiljøet, og destinationen er altid i cloudmiljøet.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Dataflow bruger et effektivt transformationsprogram

Power Query er det datatransformationsprogram, der bruges i dataflowet. Dette program er i stand til at understøtte mange avancerede transformationer. Den bruger også en enkel, men effektiv grafisk brugergrænseflade kaldet Power Query-editor. Du kan bruge dataflow med denne editor til at udvikle dine løsninger til dataintegration hurtigere og nemmere.

Screenshot showing an example of Power Query transformations.

Integration af dataflow med Microsoft Power Platform og Dynamics 365

Da et dataflow gemmer de resulterende tabeller i et cloudbaseret lager, kan andre tjenester interagere med de data, der produceres af dataflow.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- og Dynamics 365-programmer kan f.eks. hente de data, der produceres af dataflowet, ved at oprette forbindelse til Dataverse, en Power Platform-dataflowconnector eller direkte via søen, afhængigt af den destination, der er konfigureret på oprettelsestidspunktet for dataflowet.

Fordele ved dataflow

På følgende liste fremhæves nogle af fordelene ved at bruge dataflow:

  • Et dataflow afkobler datatransformationslaget fra udformnings- og visualiseringslaget i en Power BI-løsning.

  • Datatransformationskoden kan være placeret på en central placering, et dataflow, i stedet for at være fordelt på flere artefakter.

  • En opretter af dataflow har kun brug for Power Query-færdigheder. I et miljø med flere oprettere kan opretteren af dataflowet være en del af et team, der sammen bygger hele BI-løsningen eller driftsprogrammet.

  • Et dataflow er produktagnostisk. Det er ikke kun en komponent i Power BI. du kan hente dataene i andre værktøjer og tjenester.

  • Dataflow drager fordel af Power Query, som er en effektiv, grafisk og selvbetjent datatransformationsoplevelse.

  • Dataflow kører udelukkende i cloudmiljøet. Der kræves ingen yderligere infrastruktur.

  • Du har flere muligheder for at begynde at arbejde med dataflow ved hjælp af licenser til Power Apps, Power BI og Customer Insights.

  • Selvom dataflow er i stand til avancerede transformationer, er de designet til selvbetjeningsscenarier og kræver ingen it- eller udviklerbaggrund.

Use-case-scenarier til dataflow

Du kan bruge dataflow til mange formål. Følgende scenarier indeholder et par eksempler på almindelige use cases for dataflows.

Dataoverførsel fra ældre systemer

I dette scenarie har en organisation truffet beslutning om at bruge Power Apps til den nye brugergrænsefladeoplevelse i stedet for det ældre lokale system. Power Apps, Power Automate og AI Builder bruger alle Dataverse som det primære datalagersystem. De aktuelle data i det eksisterende lokale system kan overføres til Dataverse ved hjælp af et dataflow, og derefter kan disse produkter bruge disse data.

Brug af dataflow til at oprette et data warehouse

Du kan bruge dataflow som erstatning for andre værktøjer til udtrækning, transformering, indlæsning (ETL) til oprettelse af et data warehouse. I dette scenarie beslutter en virksomheds datateknikere at bruge dataflow til at bygge deres stjerneskemadesignet data warehouse, herunder fakta- og dimensionstabeller i Data Lake Storage. Derefter bruges Power BI til at generere rapporter og dashboards ved at hente data fra dataflowene.

Image of how to build a data warehouse using dataflows.

Brug af dataflow til at oprette en dimensionel model

Du kan bruge dataflow som erstatning for andre ETL-værktøjer til at oprette en dimensionel model. Datateknikerne i en virksomhed beslutter f.eks. at bruge dataflow til at bygge den stjerneskemadesignede dimensionelle model, herunder fakta- og dimensionstabeller i Azure Data Lake Storage Gen2. Derefter bruges Power BI til at generere rapporter og dashboards ved at hente data fra dataflowene.

Image of how to build a dimensional model using dataflows.

Centraliser dataforberedelse og genbrug af semantiske modeller på tværs af flere Power BI-løsninger

Hvis flere Power BI-løsninger bruger den samme transformerede version af en tabel, gentages processen til oprettelse af tabellen flere gange. Dette øger belastningen af kildesystemet, forbruger flere ressourcer og opretter duplikerede data med flere fejlpunkter. I stedet kan der oprettes et enkelt dataflow for at beregne dataene for alle løsninger. Power BI kan derefter genbruge resultatet af transformationen i alle løsninger. Hvis dataflowet bruges på en sådan måde, kan det være en del af en robust Power BI-implementeringsarkitektur, der undgår dubletter af Power Query-koden og reducerer vedligeholdelsesomkostningerne for dataintegrationslaget.

Image of how tables can be reused across multiple solutions.

Næste trin

Følgende artikler indeholder yderligere undersøgelsesmateriale til dataflow.