Konfigurer dataflowlager til at bruge Azure Data Lake Gen 2
Data, der bruges sammen med Power BI, gemmes som standard i det interne lager, der leveres af Power BI. Med integrationen af dataflow og Azure Data Lake Storage Gen 2 (ADLS Gen2) kan du gemme dine dataflow på din organisations Azure Data Lake Storage Gen2-konto. Denne funktion giver dig grundlæggende mulighed for at "medbringe dit eget lager" til Power BI-dataflow og oprette en forbindelse på lejer- eller arbejdsområdeniveau.
Årsager til at bruge ADLS Gen 2-arbejdsområdet eller lejerforbindelsen
Når du har vedhæftet dit dataflow, konfigurerer og gemmer Power BI en reference, så du nu kan læse og skrive data til din egen ADLS Gen 2. Power BI gemmer dataene i CDM-formatet (Common Data Model), som henter metadata om dine data ud over de faktiske data, der genereres af selve dataflowet. Denne funktion låser op for mange effektive funktioner og gør det muligt for dine data og de tilknyttede metadata i CDM-format nu at betjene udvidelses-, automatiserings-, overvågnings- og sikkerhedskopieringsscenarier. Når du gør disse data tilgængelige og bredt tilgængelige i dit eget miljø, giver det dig mulighed for at demokratisere den indsigt og de data, der er oprettet i din organisation. Det giver dig også mulighed for at oprette yderligere løsninger med en bred vifte af kompleksitet. Dine løsninger kan være CDM-orienterede brugerdefinerede programmer og løsninger i Power Platform, Azure og dem, der er tilgængelige via ISV-økosystemer (Partner and Independent Software Vendor). Eller du kan oprette et program for at læse en CSV. Dine datateknikere, dataspecialister og analytikere kan nu arbejde med, bruge og genbruge et fælles datasæt, der er organiseret i ADLS Gen 2.
Der er to måder at konfigurere, hvilken ADLS Gen 2-butik der skal bruges: Du kan bruge en ADLS Gen 2-konto, der er tildelt lejeren, eller du kan medbringe din egen ADLS Gen 2-butik på arbejdsområdeniveau.
Forudsætninger
Hvis du vil medbringe din egen ADLS Gen 2-konto, skal du have ejertilladelse på lagerkontolaget. Tilladelser på ressourcegruppe- eller abonnementsniveau fungerer ikke. Hvis du er administrator, skal du stadig tildele dig selv tilladelsen Ejer. Understøtter i øjeblikket ikke ADLS Gen2 Storage Accounts bag en firewall.
Lagerkontoen skal oprettes med det hierarkiske navneområde (HNS) aktiveret.
Lagerkontoen skal oprettes i den samme Microsoft Entra-lejer som Power BI-lejeren.
Brugeren skal have rollen Lager-blobdataejer, rollen Lager-Blob Datalæser og rollen Ejer på lagerkontoniveau (omfanget skal være denne ressource og ikke nedarvet). Det kan tage nogle minutter at synkronisere eventuelle anvendte rolleændringer, og de skal synkroniseres, før følgende trin kan fuldføres i Power BI-tjeneste.
Lejerområdet for Power BI-arbejdsområdet skal være det samme som området for lagerkontoen.
TLS (Transport Layer Security) version 1.2 (eller nyere) er påkrævet for at sikre dine slutpunkter. Webbrowsere og andre klientprogrammer, der bruger TLS-versioner, der er ældre end TLS 1.2, kan ikke oprette forbindelse.
Tilknytning af et dataflow med ADLS Gen 2 bag multifaktorgodkendelse (MFA) understøttes ikke.
Endelig kan du oprette forbindelse til en ADLS Gen 2 fra Administration-portalen, men hvis du opretter forbindelse direkte til et arbejdsområde, skal du først sikre dig, at der ikke er nogen dataflow i arbejdsområdet, før du opretter forbindelse.
Bemærk
Medbring dit eget lager (Azure Data Lake Gen 2) er ikke tilgængeligt i Power BI-tjeneste for GCC-kunder i USA. Du kan få flere oplysninger om, hvilke funktioner der er tilgængelige, og hvilke der ikke er, under Tilgængelighed af Power BI-funktioner for amerikanske offentlige myndigheder.
I følgende tabel beskrives de tilladelser til ADLS og Power BI, der kræves til ADLS Gen 2 og Power BI:
Handling | ADLS-tilladelser | Minimumtilladelser til Power BI |
---|---|---|
Forbind ADLS Gen 2 til Power BI-lejer | Ejer | Power BI-administrator |
Forbind ADLS Gen 2 til arbejdsområde | Ejer | Administrator af arbejdsområde |
Opret Power BI-dataflow, der skriver tilbage til en tilsluttet ADLS-konto | Ikke tilgængelig | Bidragyder til arbejdsområde |
Forbrug Power BI-dataflow | Ikke tilgængelig | Arbejdsområdefremviser |
Forbind til en Azure Data Lake Gen 2 på arbejdsområdeniveau
Naviger til et arbejdsområde, der ikke har nogen dataflow. Vælg Indstillinger for arbejdsområde. Vælg fanen Azure Forbind ions, og vælg derefter afsnittet Lager.
Indstillingen Brug Azure-standardforbindelse er synlig, hvis administratoren allerede har konfigureret en ADLS Gen 2-konto, der er tildelt lejeren. Du har to muligheder:
- Brug den lejerkonfigurerede ADLS Gen 2-konto ved at markere afkrydsningsfeltet Brug Azure-standardforbindelsen, eller
- Vælg Forbind til Azure for at pege på en ny Azure Storage-konto.
Når du vælger Forbind til Azure, henter Power BI en liste over Azure-abonnementer, som du har adgang til. Udfyld rullemenuerne. Vælg derefter et gyldigt Azure-abonnement, en gyldig ressourcegruppe og en gyldig lagerkonto, hvor indstillingen hierarkisk navneområde er aktiveret, hvilket er ADLS Gen2-flaget. Den personlige konto, der bruges til at oprette forbindelse til Azure, bruges kun én gang til at angive den indledende forbindelse og tildele den Power BI-tjeneste konto rettigheder til at læse og skrive data, hvorefter den oprindelige brugerkonto ikke længere er nødvendig for at holde forbindelsen aktiv.
Når du har valgt dit valgte, skal du vælge Gem , så har du nu oprettet forbindelse mellem arbejdsområdet og din egen ADLS Gen2-konto. Power BI konfigurerer automatisk lagerkontoen med de påkrævede tilladelser og konfigurerer Det Power BI-filsystem, hvor dataene skal skrives. På dette tidspunkt skriver alle dataflowets data i dette arbejdsområde direkte til dette filsystem, som kan bruges sammen med andre Azure-tjenester. Du har nu en enkelt kilde til alle dine organisations- eller afdelingsdata.
Konfiguration af Azure-forbindelser
Konfiguration af Azure-forbindelser er en valgfri indstilling med flere egenskaber, der eventuelt kan angives:
- Lager på lejerniveau, som du kan bruge til at angive en standard og/eller
- Lager på arbejdsområdeniveau, hvor du kan angive forbindelsen pr. arbejdsområde
Du kan eventuelt konfigurere lager på lejerniveau, hvis du kun vil bruge en central datasø, eller hvis dette lager skal være standardindstillingen. Vi starter ikke automatisk med at bruge standarden for at give fleksibilitet i din konfiguration, så du har fleksibilitet til at konfigurere de arbejdsområder, der bruger denne forbindelse, efter behov. Hvis du konfigurerer en ADLS Gen 2-konto, der er tildelt lejeren, skal du stadig konfigurere hvert arbejdsområde for at bruge denne standardindstilling.
Du kan eventuelt konfigurere lagertilladelser på arbejdsområdeniveau som en separat indstilling, hvilket giver fuld fleksibilitet til at angive en bestemt ADLS Gen 2-konto for et arbejdsområde efter arbejdsområde.
Hvis lager på lejerniveau og lagertilladelser på arbejdsområdeniveau er tilladt, kan administratorer af arbejdsområder vælge at bruge ADLS-standardforbindelsen eller vælge at konfigurere en anden lagerkonto, der er adskilt fra standarden. Hvis lejerlageret ikke er angivet, kan arbejdsområdeadministratorer eventuelt konfigurere ADLS-konti på et arbejdsområde efter arbejdsområde. Hvis lager på lejerniveau er valgt, og lager på arbejdsområdeniveau ikke er tilladt, kan administratorer af arbejdsområdet eventuelt konfigurere deres dataflow til at bruge denne forbindelse.
Struktur og format for ADLS Gen 2-arbejdsområdeforbindelser
I ADLS Gen 2-lagerkontoen gemmes alle dataflow i filsystemets powerbi-objektbeholder .
Strukturen af powerbi-objektbeholderen ser sådan ud: <workspace name>/<dataflow name>/model.json
, <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>
og<workspace name>/<dataflow name>/<table name>/<tablesnapshots>
Den placering, hvor dataflow gemmer data i mappehierarkiet for ADLS Gen 2, er den samme, uanset om arbejdsområdet er placeret i delt kapacitet eller Premium-kapacitet.
I følgende eksempel bruges tabellen Orders i Odata-eksemplet Northwind.
På det foregående billede:
- Model.json er den nyeste version af dataflowet.
- Model.json.snapshots er alle tidligere versioner af dataflowet. Denne historik er nyttig, hvis du har brug for en tidligere version af miks eller trinvise indstillinger.
- Tablename er den mappe, der indeholder de resulterende data, når en opdatering af dataflowet er fuldført.
Vi skriver kun til denne lagerkonto og sletter i øjeblikket ikke data. Så selv efter fjernelsen sletter vi ikke fra ADLS-kontoen, så alle de filer, der er nævnt på den foregående liste, gemmes stadig.
Bemærk
Dataflow gør det muligt at sammenkæde eller referere til data, der er angivet i andre dataflow. I sådanne dataflow kan filen model.json referere til en anden model.json for et andet dataflow i det samme eller et andet arbejdsområde.
Flytter filer mellem/inden for ADLS Gen 2-lagerkonti
Når du flytter et dataflow fra én ADLS Gen2-lagerkonto til en anden, skal du sørge for, at stierne i filen model.json opdateres, så de afspejler den nye placering. Det skyldes, at filen model.json indeholder stien til dataflowet og stien til dataene. Hvis du ikke opdaterer stierne, kan dataflowet ikke finde dataene og forårsage tilladelsesfejl. Hvis du vil opdatere stierne, kan du bruge følgende trin:
- Åbn filen model.json i en teksteditor.
- Find URL-adressen til lagerkontoen, og erstat den med URL-adressen til den nye lagerkonto.
- Gem filen.
- Overskriv den eksisterende model.json-fil i ADLS Gen2-lagerkontoen.
Udvidelse af ADLS Gen 2-arbejdsområdeforbindelser
Hvis du opretter forbindelse mellem ADLS Gen 2 og Power BI, kan du gøre denne handling på arbejdsområde- eller lejerniveau. Sørg for, at du har det rigtige adgangsniveau. Få mere at vide under Forudsætninger.
Lagerstrukturen overholder common datamodelformatet. Få mere at vide om lagerstrukturen og CDM ved at gå til Hvad er lagerstrukturen for analytiske dataflow ogBrug Common Data Model til at optimere Azure Data Lake Storage Gen2.
Når dataene og metadataene er konfigureret korrekt, er de i dit kontrolelement. Mange programmer er opmærksomme på CDM, og dataene kan udvides ved hjælp af Azure, PowerApps og PowerAutomate. Du kan også bruge tredjepartsøkosystemer enten ved at overholde formatet eller ved at læse rådata.
Fjern Tilknytning af Azure Data Lake Gen 2 fra et arbejdsområde eller en lejer
Hvis du vil fjerne en forbindelse på arbejdsområdeniveau, skal du først sikre dig, at alle dataflow i arbejdsområdet slettes. Når alle dataflow er blevet fjernet, skal du vælge Afbryd forbindelsen i indstillingerne for arbejdsområdet. Det samme gælder for en lejer, men du skal først sikre dig, at alle arbejdsområder også er blevet afbrudt fra lejerlagerkontoen, før du kan afbryde forbindelsen på lejerniveau.
Deaktiver Azure Data Lake Gen 2
I Administration-portalen under dataflow kan du deaktivere adgang for brugere, så de enten kan bruge denne funktion, og du kan ikke tillade, at administratorer af arbejdsområder medbringer deres eget Azure Storage.
Vend tilbage fra Azure Data Lake Gen 2
Når dataflowlageret er konfigureret til at bruge Azure Data Lake Gen 2, er der ingen måde at gendanne automatisk. Processen til at vende tilbage til Power BI-administreret lager er manuel.
Hvis du vil gendanne den migrering, du har foretaget til Gen 2, skal du slette dine dataflow og genoprette dem i det samme arbejdsområde. Da vi derefter ikke sletter data fra ADLS Gen 2, skal du gå til selve ressourcen og rydde op i dataene. Denne handling omfatter følgende trin.
Eksportér en kopi af dataflowet fra Power BI. Du kan også kopiere filen model.json. Filen model.json er gemt i ADLS.
Slet dataflowene.
Afmonter ADLS.
Opret dataflowet igen ved hjælp af import. Trinvise opdateringsdata (hvis relevant) skal slettes før importen. Denne handling kan udføres ved at slette de relevante partitioner i filen model.json.
Konfigurer politikker for opdatering/genopret trinvis opdatering.
Forbind til dataene ved hjælp af ADLS Gen 2-connectoren
Omfanget af dette dokument beskriver ADLS Gen 2-dataflowforbindelser og ikke Power BI ADLS Gen 2-connectoren. Det er et separat scenarie at arbejde med ADLS Gen 2-connectoren. ADLS-connectoren bruger blot ADLS som datakilde. Så hvis du bruger Power Query Online til at forespørge på disse data, behøver det ikke at være i CDM-format, det kan være det dataformat, som kunden ønsker. Du kan få flere oplysninger under Azure Data Lake Storage Gen2.
Relateret indhold
Følgende artikler indeholder flere oplysninger om dataflow og Power BI: