Utvikle løsninger med dataflyter
Power BI-dataflyter er en bedriftsfokusert dataforberedelsesløsning som muliggjør et økosystem av data som er klar for forbruk, gjenbruk og integrering. Denne artikkelen presenterer noen vanlige scenarier, koblinger til artikler og annen informasjon for å hjelpe deg med å forstå og bruke dataflyter til sitt fulle potensial.
Få tilgang til Premium-funksjoner i dataflyter
Power BI-dataflyter i Premium-kapasiteter gir mange viktige funksjoner som bidrar til å oppnå større skala og ytelse for dataflytene, for eksempel:
- Avansert databehandling, som akselererer ETL-ytelse og gir DirectQuery-funksjoner.
- Trinnvis oppdatering, som lar deg laste inn data som er endret fra en kilde.
- Koblede enheter, som du kan bruke til å referere til andre dataflyter.
- Beregnede enheter, som du kan bruke til å bygge komposterbare byggeblokker av dataflyter som inneholder mer forretningslogikk.
Av disse grunnene anbefaler vi at du bruker dataflyter i en Premium-kapasitet når det er mulig. Dataflyter som brukes i en Power BI Pro-lisens, kan brukes til enkle brukstilfeller i liten skala.
Løsning
Det er mulig å få tilgang til disse Premium-funksjonene for dataflyter på to måter:
- Angi en Premium-kapasitet til et gitt arbeidsområde, og ta med din egen Pro-lisens for å redigere dataflyter her.
- Ta med din egen Premium per bruker (PPU)-lisens, som krever at andre medlemmer av arbeidsområdet også har en PPU-lisens.
Du kan ikke bruke PPU-dataflyter (eller annet innhold) utenfor PPU-miljøet (for eksempel i Premium eller andre SKU-er eller lisenser).
For Premium-kapasiteter trenger ikke forbrukerne av dataflyter i Power BI Desktop eksplisitte lisenser for å bruke og publisere til Power BI. Men hvis du vil publisere til et arbeidsområde eller dele en resulterende semantisk modell, trenger du minst en Pro-lisens.
For PPU må alle som oppretter eller bruker PPU-innhold, ha en PPU-lisens. Dette kravet varierer fra resten av Power BI ved at du må eksplisitt lisensiere alle med PPU. Du kan ikke blande kostnadsfrie, pro- eller Premium-kapasiteter med PPU-innhold med mindre du overfører arbeidsområdet til en Premium-kapasitet.
Valg av modell avhenger vanligvis av organisasjonens størrelse og mål, men følgende retningslinjer gjelder.
Teamtype | Premium per kapasitet | Premium per bruker |
---|---|---|
>5000 brukere | ✔ | |
<5000 brukere | ✔ |
For små team kan PPU bygge bro mellom Gratis, Pro og Premium per kapasitet. Hvis du har større behov, er det best å bruke en Premium-kapasitet med brukere som har Pro-lisenser.
Opprett brukerdataflyter med sikkerhet brukt
Tenk deg at du må opprette dataflyter for forbruk, men har sikkerhetskrav:
I dette scenarioet har du sannsynligvis to typer arbeidsområder:
Bakarbeidsområder der du utvikler dataflyter og bygger ut forretningslogikken.
Brukerarbeidsområder der du vil vise noen dataflyter eller tabeller til en bestemt gruppe brukere for forbruk:
- Brukerarbeidsområdet inneholder koblede tabeller som peker til dataflytene i bakarbeidsområdet.
- Brukere har visningstilgang til forbrukerarbeidsområdet og ingen tilgang til bakarbeidsområdet.
- Når en bruker bruker Power BI Desktop til å få tilgang til en dataflyt i brukerarbeidsområdet, kan de se dataflyten. Men fordi dataflyten vises tom i navigatøren, vises ikke de koblede tabellene.
Forstå koblede tabeller
Koblede tabeller er ganske enkelt en peker til de opprinnelige dataflyttabellene, og de arver kildens tillatelse. Hvis Power BI tillot den koblede tabellen å bruke måltillatelsen, kan alle brukere omgå kildetillatelsen ved å opprette en koblet tabell i målet som peker til kilden.
Løsning: Bruk beregnede tabeller
Hvis du har tilgang til Power BI Premium, kan du opprette en beregnet tabell i målet som refererer til den koblede tabellen, som har en kopi av dataene fra den koblede tabellen. Du kan fjerne kolonner gjennom projeksjoner og fjerne rader gjennom filtre. Brukeren med tillatelse på målarbeidsområdet kan få tilgang til data gjennom denne tabellen.
Avstamming for privilegerte personer viser også det refererte arbeidsområdet og lar brukere koble tilbake for å forstå den overordnede dataflyten fullt ut. Personvernet respekteres fortsatt for brukerne som ikke er privilegerte. Bare navnet på arbeidsområdet vises.
Diagrammet nedenfor illustrerer dette oppsettet. Til venstre er det arkitektoniske mønsteret. Til høyre er et eksempel som viser deling av salgsdata og sikret etter område.
Redusere oppdateringstider for dataflyter
Tenk deg at du har en stor dataflyt, men du vil bygge semantiske modeller av den dataflyten og redusere tiden det tar å oppdatere den. Oppdateringer tar vanligvis lang tid å fullføre fra datakilden til dataflyter til semantisk modell. Lange oppdateringer er vanskelige å administrere eller vedlikeholde.
Løsning: Bruk tabeller med Aktiver innlasting eksplisitt konfigurert for refererte tabeller, og ikke deaktiver innlasting
Power BI støtter enkel orkestrering for dataflyter, som definert i å forstå og optimalisere oppdatering av dataflyter. Hvis du drar nytte av orkestrering, må du eksplisitt ha dataflyter som er konfigurert for å aktivere innlasting.
Deaktivering av innlasting passer vanligvis bare når kostnadene ved innlasting av flere spørringer avbryter fordelen for enheten du utvikler.
Selv om deaktivering av belastning betyr at Power BI ikke evaluerer den angitte spørringen, når den brukes som ingredienser, det vil si referert i andre dataflyter, betyr det også at Power BI ikke behandler den som en eksisterende tabell der vi kan gi en peker til og utføre folding og spørringsoptimaliseringer. I denne forstand er utføring av transformasjoner som sammenføyning eller fletting bare en sammenføyning eller fletting av to datakildespørringer. Slike operasjoner kan ha en negativ effekt på ytelsen, fordi Power BI må laste inn allerede beregnet logikk på nytt og deretter bruke mer logikk.
Hvis du vil forenkle spørringsbehandlingen av dataflyten og sikre at alle motoroptimaliseringer finner sted, aktiverer du innlasting og sikrer at databehandlingsmotoren i Power BI Premium-dataflyter er angitt som standardinnstilling, som er optimalisert.
Hvis du aktiverer innlasting, kan du også beholde hele visningen av avstamming, fordi Power BI anser en ikke-aktivert innlastingsdataflyt som et nytt element. Hvis avstamming er viktig for deg, må du ikke deaktivere innlasting for enheter eller dataflyter som er koblet til andre dataflyter.
Redusere oppdateringstidene for semantiske modeller
Tenk deg at du har en dataflyt som er stor, men du vil bygge semantiske modeller ut av den og redusere orkestreringen. Oppdateringer tar lang tid å fullføre fra datakilden til dataflyter til semantiske modeller, noe som gir økt ventetid.
Løsning: Bruk DirectQuery-dataflyter
DirectQuery kan brukes når et arbeidsområdes utvidede innstilling for databehandlingsmotor (ECE) er konfigurert eksplisitt til På. Denne innstillingen er nyttig når du har data som ikke trenger å lastes direkte inn i en Power BI-modell. Hvis du konfigurerer ECE-en til å være på for første gang, vil endringene som tillater DirectQuery, skje under neste oppdatering. Du må oppdatere den når du aktiverer at endringene skal skje umiddelbart. Oppdateringer av den første dataflytbelastningen kan gå tregere fordi Power BI skriver data til både lagring og en administrert SQL-motor.
Hvis du vil oppsummere, kan du bruke DirectQuery med dataflyter til å gjøre følgende forbedringer i Power BI- og dataflytprosessene:
- Unngå separate oppdateringsplaner: DirectQuery kobler direkte til en dataflyt, noe som fjerner behovet for å opprette en importert semantisk modell. Ved å bruke DirectQuery med dataflytene, trenger du derfor ikke lenger separate oppdateringsplaner for dataflyten og den semantiske modellen for å sikre at dataene synkroniseres.
- Filtrering av data: DirectQuery er nyttig for å arbeide med en filtrert visning av data i en dataflyt. Hvis du vil filtrere data, og på denne måten arbeide med et mindre delsett av dataene i dataflyten, kan du bruke DirectQuery (og ECE) til å filtrere dataflytdata og arbeide med det filtrerte delsettet du trenger.
Vanligvis handler DirectQuery oppdaterte data i den semantiske modellen med langsommere rapportytelse sammenlignet med importmodus. Vurder denne tilnærmingen bare når:
- Brukstilfellet krever at data med lav ventetid kommer fra dataflyten.
- Dataflytdataene er store.
- En import vil være for tidkrevende.
- Du er villig til å handle bufret ytelse for oppdaterte data.
Løsning: Bruk dataflytkoblingen til å aktivere spørringsdelegering og trinnvis oppdatering for import
Den enhetlige dataflytkoblingen kan redusere evalueringstiden betydelig for trinn som utføres over beregnede enheter, for eksempel å utføre sammenføyninger, distinkte, filtre og gruppere etter operasjoner. Det finnes to spesifikke fordeler:
- Nedstrømsbrukere som kobler til dataflytkoblingen i Power BI Desktop, kan dra nytte av bedre ytelse i redigeringsscenarioer fordi den nye koblingen støtter spørringsdelegering.
- Oppdateringsoperasjoner for semantisk modell kan også brettes til den forbedrede databehandlingsmotoren, noe som betyr at selv trinnvis oppdatering fra en semantisk modell kan brettes til en dataflyt. Denne funksjonen forbedrer oppdateringsytelsen og reduserer potensielt ventetiden mellom oppdateringssykluser.
Hvis du vil aktivere denne funksjonen for premium-dataflyt, må du kontrollere at databehandlingsmotoren er eksplisitt satt til På. Bruk deretter dataflytkoblingen i Power BI Desktop. Du må bruke august 2021-versjonen av Power BI Desktop eller nyere for å dra nytte av denne funksjonen.
Hvis du vil bruke denne funksjonen for eksisterende løsninger, må du være på et Premium- eller Premium Per User-abonnement. Du må kanskje også gjøre noen endringer i dataflyten som beskrevet i Bruk av den forbedrede databehandlingsmotoren. Du må oppdatere eventuelle eksisterende Power Query-spørringer for å kunne bruke den nye koblingen ved å erstatte PowerBI.Dataflows
i Kilde-delen med PowerPlatform.Dataflows
.
Kompleks dataflytredigering i Power Query
Tenk deg at du har en dataflyt som er millioner av rader med data, men du vil bygge kompleks forretningslogikk og transformasjoner med den. Du vil følge anbefalte fremgangsmåter for å arbeide med store dataflyter. Du trenger også forhåndsvisninger av dataflyten for å kunne utføres raskt. Du har imidlertid dusinvis av kolonner og millioner av rader med data.
Løsning: Bruk skjemavisning
Du kan bruke skjemavisning, som er utformet for å optimalisere flyten når du arbeider med skjemanivåoperasjoner ved å sette spørringens kolonneinformasjon foran og i midten. Skjemavisning gir kontekstavhengige interaksjoner for å forme datastrukturen. Skjemavisning gir også lavere ventetidsoperasjoner fordi det bare krever at kolonnemetadataene beregnes og ikke de fullstendige dataresultatene.
Arbeide med større datakilder
Tenk deg at du kjører en spørring på kildesystemet, men du vil ikke gi direkte tilgang til systemet eller demokratisere tilgang. Du planlegger å plassere den i en dataflyt.
Løsning 1: Bruke en visning for spørringen eller optimalisere spørringen
Ved å bruke en optimalisert datakilde og spørring er det beste alternativet. Datakilden fungerer ofte best med spørringer som er beregnet på den. Power Query fremmer spørringsdelegeringsfunksjoner for å delegere disse arbeidsbelastningene. Power BI har også trinnvise indikatorer i Power Query Online. Les mer om typer indikatorer i dokumentasjonen for trinndelegeringsindikatorer.
Løsning 2: Bruk opprinnelig spørring
Du kan også bruke Value.NativeQuery() M-funksjonen. Du angir EnableFolding=true i den tredje parameteren. Opprinnelig spørring er dokumentert på dette nettstedet for Postgres-koblingen. Det fungerer også for SQL Server-koblingen.
Løsning 3: Bryt dataflyten i inntaks- og forbruksdataflyter for å dra nytte av ECE- og Koblede enheter
Ved å bryte en dataflyt i separate inntaks- og forbruksdataflyter kan du dra nytte av ECE- og Koblede enheter. Du kan lære mer om dette mønsteret og andre i dokumentasjonen for anbefalte fremgangsmåter.
Sikre at kundene bruker dataflyter når det er mulig
Tenk deg at du har mange dataflyter som tjener vanlige formål, for eksempel samsvarende dimensjoner som kunder, datatabeller, produkter og geografier. Dataflyter er allerede tilgjengelige på båndet for Power BI. Ideelt sett vil du at kundene primært skal bruke dataflytene du opprettet.
Løsning: Bruk godkjenning til å sertifisere og fremme dataflyter
Hvis du vil lære mer om hvordan godkjenning fungerer, kan du se Godkjenning: Promotering og sertifisering av Power BI-innhold.
Programmerbarhet og automatisering i Power BI-dataflyter
Tenk deg at du har forretningskrav for å automatisere import, eksport eller oppdateringer, og mer orkestrering og handlinger utenfor Power BI. Du har noen alternativer for å aktivere dette, som beskrevet i tabellen nedenfor.
Type | Mekanisme |
---|---|
Bruk PowerAutomate-malene. | Ingen kode |
Bruk automatiseringsskript i PowerShell. | Automatiseringsskript |
Bygg din egen forretningslogikk ved hjelp av API-ene. | Rest-API |
Hvis du vil ha mer informasjon om oppdatering, kan du se Forstå og optimalisere oppdatering av dataflyter.
Sikre at du beskytter dataressurser nedstrøms
Du kan bruke følsomhetsetiketter til å bruke en dataklassifisering og eventuelle regler du har konfigurert på nedstrømselementer som kobler til dataflytene. Hvis du vil lære mer om følsomhetsetiketter, kan du se følsomhetsetiketter i Power BI. Hvis du vil se gjennom arv, kan du se Følsomhetsetikett nedstrøms arv i Power BI.
Multi-geo-støtte
Mange kunder har i dag behov for å oppfylle kravene til datasuverenitet og bosted. Du kan fullføre en manuell konfigurasjon til dataflytarbeidsområdet for å være multi-geo.
Dataflyter støtter multi-geo når de bruker funksjonen bring-your-own-storage-account. Denne funksjonen er beskrevet i konfigurering av dataflytlagring til å bruke Azure Data Lake Gen 2. Arbeidsområdet må være tomt før du legger ved denne funksjonen. Med denne bestemte konfigurasjonen kan du lagre dataflytdata i bestemte geografiske områder etter eget valg.
Sikre at du beskytter dataressurser bak et virtuelt nettverk
Mange kunder har i dag behov for å sikre dataressursene dine bak et privat endepunkt. Hvis du vil gjøre dette, kan du bruke virtuelle nettverk og en gateway for å holde deg kompatibel. Tabellen nedenfor beskriver den gjeldende virtuelle nettverksstøtten og forklarer hvordan du bruker dataflyter til å holde seg kompatible og beskytte dataressursene dine.
Scenario | Status |
---|---|
Les virtuelle nettverksdatakilder gjennom en lokal gateway. | Støttes via en lokal gateway |
Skriv data til en følsomhetsetikettkonto bak et virtuelt nettverk ved hjelp av en lokal gateway. | Støttes ennå ikke |
Relatert innhold
Følgende artikler gir mer informasjon om dataflyter og Power BI: