Aanbevolen procedures voor het hergebruik van gegevensstromen in omgevingen en werkruimten

In dit artikel wordt een verzameling aanbevolen procedures besproken voor het effectief en efficiënt hergebruiken van gegevensstromen. Lees dit artikel voor het voorkomen van valkuilen en mogelijke prestatieproblemen bij het ontwikkelen van gegevensstromen voor hergebruik.

Gegevensstromen voor gegevenstransformatie scheiden van faserings-/extractiegegevensstromen

Als een gegevensstroom alle acties uitvoert, is het moeilijk om de entiteiten opnieuw te gebruiken in andere gegevensstromen of voor andere doeleinden. De beste gegevensstromen om opnieuw te gebruiken zijn die gegevensstromen die slechts enkele acties uitvoeren. Het maken van gegevensstromen die zijn gespecialiseerd in één specifieke taak, is een van de beste manieren om ze opnieuw te gebruiken. Als u een set gegevensstromen hebt die u gebruikt als faseringsgegevensstromen, is de enige actie om gegevens op te halen uit het bronsysteem. Deze gegevensstromen kunnen opnieuw worden gebruikt in meerdere andere gegevensstromen.

Als u gegevenstransformatiegegevensstromen hebt, kunt u ze splitsen in gegevensstromen die algemene transformaties uitvoeren. Elke gegevensstroom kan slechts enkele acties uitvoeren. Deze paar acties per gegevensstroom zorgen ervoor dat de uitvoer van die gegevensstroom herbruikbaar is door andere gegevensstromen.

Dataflow doing only a few actions.

Afbeelding met gegevens die worden geëxtraheerd uit een gegevensbron naar faseringsgegevensstromen, waarbij de entiteiten zijn opgeslagen in Dataverse of Azure Data Lake-opslag, worden de gegevens verplaatst naar transformatiegegevensstromen waarin de gegevens worden getransformeerd en geconverteerd naar de structuur van het datawarehouse. Vervolgens worden de gegevens geladen in een Power BI-gegevensset.

Meerdere werkruimten gebruiken

Elke werkruimte (of omgeving) is alleen beschikbaar voor leden van die werkruimte. Als u al uw gegevensstromen in één werkruimte bouwt, minimaliseert u het hergebruik van uw gegevensstromen. U kunt enkele algemene werkruimten hebben voor gegevensstromen die bedrijfsbrede entiteiten verwerken. U kunt ook een werkruimte hebben voor gegevensstromen om entiteiten op meerdere afdelingen te verwerken. En u kunt ook enkele werkruimten hebben voor gegevensstromen die alleen in specifieke afdelingen moeten worden gebruikt.

Image showing separate workspaces.

De juiste toegangsniveaus instellen voor werkruimten

Als u toegang wilt geven tot gegevensstromen in andere werkruimten om de uitvoer van een gegevensstroom in een werkruimte te gebruiken, hoeft u ze alleen toegang te geven tot weergave in de werkruimte. Ga naar Rollen in de nieuwe werkruimten voor meer informatie over andere rollen in een Power BI-werkruimte.

Access to the workspace.

Goedkeuring van de gegevensstroom in Power BI

Er kunnen veel gegevensstromen zijn gemaakt in een tenantorganisatie en het kan moeilijk zijn voor de gebruikers om te weten welke gegevensstroom het betrouwbaarst is. Auteurs van een gegevensstroom, of degenen die toegang tot een gegevensstroom hebben, kunnen de gegevensstroom op drie niveaus goedkeuren: geen goedkeuring, gepromoveerd of gecertificeerd.

Met deze goedkeuringsniveaus kunnen gebruikers eenvoudiger en sneller betrouwbare gegevensstromen vinden. De gegevensstroom met een hoger goedkeuringsniveau wordt eerst weergegeven. De Power BI-beheerder kan de mogelijkheid om gegevensstromen naar het gecertificeerde niveau te delegeren aan andere personen. Meer informatie: Goedkeuring - Power BI-inhoud promoten en certificeren

Endorsement on dataflows.

Entiteiten in meerdere gegevensstromen scheiden

U kunt meerdere entiteiten in één gegevensstroom hebben. Een van de redenen waarom u entiteiten in meerdere gegevensstromen kunt splitsen, is wat u eerder in dit artikel hebt geleerd over het scheiden van de gegevensopname en gegevenstransformatiegegevensstromen. Een andere goede reden om entiteiten in meerdere gegevensstromen te hebben, is wanneer u een ander vernieuwingsschema wilt dan andere tabellen.

In het voorbeeld in de volgende afbeelding moet de verkooptabel elke vier uur worden vernieuwd. De datumtabel moet slechts eenmaal per dag worden vernieuwd om de huidige datumrecord bijgewerkt te houden. En een tabel met producttoewijzingen moet slechts eenmaal per week worden vernieuwd. Als u al deze tabellen in één gegevensstroom hebt, hebt u slechts één vernieuwingsoptie voor alle tabellen. Als u deze tabellen echter splitst in meerdere gegevensstromen, kunt u de vernieuwing van elke gegevensstroom afzonderlijk plannen.

Dataflows with different schedules for the refresh.

Goede tabelkandidaten voor gegevensstroomentiteiten

Wanneer u oplossingen ontwikkelt met behulp van Power Query in de bureaubladhulpprogramma's, vraagt u zich misschien af; Welke van deze tabellen zijn goede kandidaten om naar een gegevensstroom te worden verplaatst? De beste tabellen die naar de gegevensstroom moeten worden verplaatst, zijn tabellen die moeten worden gebruikt in meer dan één oplossing of meer dan één omgeving of service. De tabel Datum die in de volgende afbeelding wordt weergegeven, moet bijvoorbeeld worden gebruikt in twee afzonderlijke Power BI-bestanden. In plaats van die tabel in elk bestand te dupliceren, kunt u de tabel in een gegevensstroom als een entiteit maken en deze opnieuw gebruiken in deze Power BI-bestanden.

Shared table used in a dataflow.