Aanbevolen procedures voor het hergebruik van gegevensstromen in omgevingen en werkruimten

In dit artikel wordt een verzameling aanbevolen procedures besproken voor het effectief en efficiënt hergebruiken van gegevensstromen. Lees dit artikel om valkuilen en potentiële prestatieproblemen te voorkomen bij het ontwikkelen van gegevensstromen voor hergebruik.

Gegevensstromen voor gegevenstransformatie scheiden van faserings-/extractiegegevensstromen

Als een gegevensstroom alle acties uitvoert, is het moeilijk om de tabellen opnieuw te gebruiken in andere gegevensstromen of voor andere doeleinden. De beste gegevensstromen om opnieuw te gebruiken zijn die gegevensstromen die slechts een paar acties uitvoeren. Het maken van gegevensstromen die zijn gespecialiseerd in één specifieke taak is een van de beste manieren om ze opnieuw te gebruiken. Als u een set gegevensstromen hebt die u als faseringsgegevensstromen gebruikt, is hun enige actie het extraheren van gegevens die afkomstig zijn uit het bronsysteem. Deze gegevensstromen kunnen opnieuw worden gebruikt in meerdere andere gegevensstromen.

Als u gegevensstromen voor gegevenstransformatie hebt, kunt u deze splitsen in gegevensstromen die algemene transformaties uitvoeren. Elke gegevensstroom kan slechts enkele acties uitvoeren. Deze paar acties per gegevensstroom zorgen ervoor dat de uitvoer van die gegevensstroom opnieuw kan worden gebruikt door andere gegevensstromen.

Dataflow doing only a few actions.

Afbeelding met gegevens die uit een gegevensbron worden geëxtraheerd naar faseringsgegevensstromen, waarbij de tabellen worden opgeslagen in Dataverse of Azure Data Lake Storage. Vervolgens worden de gegevens verplaatst naar transformatiegegevensstromen waarin de gegevens worden getransformeerd en geconverteerd naar de datawarehouse-structuur. Ten slotte worden de gegevens geladen in een semantisch Power BI-model.

Meerdere werkruimten gebruiken

Elke werkruimte (of omgeving) is alleen beschikbaar voor leden van die werkruimte. Als u al uw gegevensstromen in één werkruimte bouwt, minimaliseert u het hergebruik van uw gegevensstromen. U kunt enkele algemene werkruimten hebben voor gegevensstromen die bedrijfsbrede tabellen verwerken. U kunt ook enkele werkruimten voor gegevensstromen hebben om tabellen over meerdere afdelingen te verwerken. En u kunt ook enkele werkruimten hebben voor gegevensstromen die alleen in specifieke afdelingen moeten worden gebruikt.

Image showing the separate workspaces.

De juiste toegangsniveaus instellen voor werkruimten

Als u toegang wilt verlenen tot gegevensstromen in andere werkruimten om de uitvoer van een gegevensstroom in een werkruimte te kunnen gebruiken, hoeft u ze alleen toegang te geven tot weergave in de werkruimte. Ga naar Rollen in de nieuwe werkruimten voor meer informatie over andere rollen in een Power BI-werkruimte.

Screenshot showing how to access to the Power BI workspace.

Goedkeuring voor de gegevensstroom in Power BI

Er kunnen veel gegevensstromen zijn gemaakt in een tenantorganisatie en het kan lastig zijn voor de gebruikers om te weten welke gegevensstroom het betrouwbaarst is. Auteurs van een gegevensstroom of gebruikers die toegang tot een gegevensstroom hebben, kunnen de gegevensstroom op drie niveaus goedkeuren: geen goedkeuring, gepromoveerd of gecertificeerd.

Deze goedkeuringsniveaus helpen gebruikers om betrouwbare gegevensstromen gemakkelijker en sneller te vinden. De gegevensstroom met een hoger goedkeuringsniveau wordt eerst weergegeven. De Power BI-beheerder kan de mogelijkheid voor het goedkeuren van gegevensstromen delegeren aan het gecertificeerde niveau aan andere personen. Meer informatie: Goedkeuring - Power BI-inhoud promoten en certificeren

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Tabellen in meerdere gegevensstromen scheiden

U kunt meerdere tabellen in één gegevensstroom hebben. Een van de redenen waarom u tabellen in meerdere gegevensstromen kunt splitsen, is wat u eerder in dit artikel hebt geleerd over het scheiden van de gegevensopname en gegevenstransformatiegegevensstromen. Een andere goede reden om tabellen in meerdere gegevensstromen te hebben, is wanneer u een ander vernieuwingsschema wilt dan andere tabellen.

In het voorbeeld dat in de volgende afbeelding wordt weergegeven, moet de verkooptabel elke vier uur worden vernieuwd. De datumtabel moet slechts eenmaal per dag worden vernieuwd om de huidige datumrecord bijgewerkt te houden. En een tabel voor producttoewijzing moet slechts eenmaal per week worden vernieuwd. Als u al deze tabellen in één gegevensstroom hebt, hebt u slechts één vernieuwingsoptie voor alle tabellen. Als u deze tabellen echter splitst in meerdere gegevensstromen, kunt u de vernieuwing van elke gegevensstroom afzonderlijk plannen.

Image showing dataflows with different schedules for the refresh.

Goede tabelkandidaten voor gegevensstroomtabellen

Wanneer u oplossingen ontwikkelt met behulp van Power Query in de bureaubladhulpprogramma's, vraagt u zich misschien af; Welke van deze tabellen zijn goede kandidaten om naar een gegevensstroom te worden verplaatst? De beste tabellen die naar de gegevensstroom moeten worden verplaatst, zijn de tabellen die in meer dan één oplossing of meer dan één omgeving of service moeten worden gebruikt. De tabel Datum die in de volgende afbeelding wordt weergegeven, moet bijvoorbeeld worden gebruikt in twee afzonderlijke Power BI-bestanden. In plaats van die tabel in elk bestand te dupliceren, kunt u de tabel in een gegevensstroom als een tabel maken en deze opnieuw gebruiken in die Power BI-bestanden.

Image showing a shared table used in a dataflow.