Wat zijn gegevensstromen?

Tip

Probeer Dataflow Gen2 uit in Data Factory in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .

Gegevensstromen zijn een selfservicetechnologie voor gegevensvoorbereiding in de cloud. Met gegevensstromen kunnen klanten gegevens opnemen, transformeren en laden in Microsoft Dataverse-omgevingen, Power BI-werkruimten of het Azure Data Lake Storage-account van uw organisatie. Gegevensstromen worden gemaakt met behulp van Power Query, een geïntegreerde gegevensconnectiviteit en voorbereidingservaring die al in veel Microsoft-producten wordt aanbevolen, waaronder Excel en Power BI. Klanten kunnen gegevensstromen activeren om op aanvraag of automatisch volgens een schema uit te voeren; gegevens worden altijd up-to-date gehouden.

Gegevensstromen kunnen worden gemaakt in meerdere Microsoft-producten

Gegevensstromen worden weergegeven in meerdere Microsoft-producten en vereisen geen licentie voor een gegevensstroom die specifiek is voor het maken of uitvoeren van gegevensstromen. Gegevensstromen zijn beschikbaar in Power Apps, Power BI en Dynamics 365 Customer Insights. De mogelijkheid om gegevensstromen te maken en uit te voeren, wordt gebundeld met de licenties van deze producten. Gegevensstroomfuncties zijn meestal gebruikelijk voor alle producten waarin ze worden aanbevolen, maar sommige productspecifieke functies kunnen bestaan in gegevensstromen die zijn gemaakt in het ene product versus het andere.

Hoe werkt de gegevensstroom?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

In de vorige afbeelding ziet u een algemeen overzicht van hoe een gegevensstroom wordt gedefinieerd. Een gegevensstroom haalt gegevens op uit verschillende gegevensbronnen (meer dan 80 gegevensbronnen worden al ondersteund). Vervolgens, op basis van de transformaties die zijn geconfigureerd met de ontwerpervaring van Power Query, transformeert de gegevensstroom de gegevens met behulp van de gegevensstroomengine. Ten slotte worden de gegevens geladen naar de uitvoerbestemming. Dit kan een Microsoft Power Platform-omgeving, een Power BI-werkruimte of het Azure Data Lake Storage-account van de organisatie zijn.

Gegevensstromen worden uitgevoerd in de cloud

Gegevensstromen zijn gebaseerd op de cloud. Wanneer een gegevensstroom is gemaakt en opgeslagen, wordt de definitie ervan opgeslagen in de cloud. Een gegevensstroom wordt ook uitgevoerd in de cloud. Als een gegevensbron echter on-premises is, kan een on-premises gegevensgateway worden gebruikt om de gegevens uit de cloud te extraheren. Wanneer een gegevensstroomuitvoering wordt geactiveerd, vindt de gegevenstransformatie en -berekening plaats in de cloud en bevindt de bestemming zich altijd in de cloud.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Gegevensstromen maken gebruik van een krachtige transformatie-engine

Power Query is de engine voor gegevenstransformatie die wordt gebruikt in de gegevensstroom. Deze engine is geschikt om veel geavanceerde transformaties te ondersteunen. Het maakt ook gebruik van een eenvoudige, maar krachtige, grafische gebruikersinterface genaamd Power Query-editor. U kunt gegevensstromen met deze editor gebruiken om uw oplossingen voor gegevensintegratie sneller en eenvoudiger te ontwikkelen.

Screenshot showing an example of Power Query transformations.

Integratie van gegevensstromen met Microsoft Power Platform en Dynamics 365

Omdat een gegevensstroom de resulterende tabellen opslaat in opslag in de cloud, kunnen andere services communiceren met de gegevens die worden geproduceerd door gegevensstromen.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- en Dynamics 365-toepassingen kunnen bijvoorbeeld de gegevens ophalen die door de gegevensstroom worden geproduceerd door verbinding te maken met Dataverse, een Power Platform-gegevensstroomconnector of rechtstreeks via de lake, afhankelijk van het doel dat is geconfigureerd tijdens het maken van de gegevensstroom.

Voordelen van gegevensstromen

In de volgende lijst ziet u enkele voordelen van het gebruik van gegevensstromen:

  • Een gegevensstroom koppelt de gegevenstransformatielaag los van de modellerings- en visualisatielaag in een Power BI-oplossing.

  • De code voor gegevenstransformatie kan zich op een centrale locatie bevinden, een gegevensstroom, in plaats van verspreid te worden over meerdere artefacten.

  • Een maker van een gegevensstroom heeft alleen Power Query-vaardigheden nodig. In een omgeving met meerdere makers kan de maker van de gegevensstroom deel uitmaken van een team dat samen de volledige BI-oplossing of operationele toepassing bouwt.

  • Een gegevensstroom is productneutraal. Het is niet alleen een onderdeel van Power BI; u kunt de bijbehorende gegevens ophalen in andere hulpprogramma's en services.

  • Gegevensstromen profiteren van Power Query, een krachtige, grafische, selfservice voor gegevenstransformatie.

  • Gegevensstromen worden volledig uitgevoerd in de cloud. Er is geen extra infrastructuur vereist.

  • U hebt meerdere opties voor het werken met gegevensstromen, met behulp van licenties voor Power Apps, Power BI en Customer Insights.

  • Hoewel gegevensstromen geschikt zijn voor geavanceerde transformaties, zijn ze ontworpen voor selfservicescenario's en hebben ze geen IT- of ontwikkelaarsachtergrond nodig.

Use-casescenario's voor gegevensstromen

U kunt gegevensstromen voor veel doeleinden gebruiken. De volgende scenario's bevatten enkele voorbeelden van veelvoorkomende gebruiksvoorbeelden voor gegevensstromen.

Gegevensmigratie van verouderde systemen

In dit scenario is de beslissing genomen door een organisatie om Power Apps te gebruiken voor de nieuwe gebruikersinterface-ervaring in plaats van het verouderde on-premises systeem. Power Apps, Power Automate en AI Builder gebruiken allemaal Dataverse als primair systeem voor gegevensopslag. De huidige gegevens in het bestaande on-premises systeem kunnen worden gemigreerd naar Dataverse met behulp van een gegevensstroom en vervolgens kunnen deze producten die gegevens gebruiken.

Gegevensstromen gebruiken om een datawarehouse te bouwen

U kunt gegevensstromen gebruiken als vervanging voor andere ETL-hulpprogramma's (extract, transform, load) om een datawarehouse te bouwen. In dit scenario besluiten de data engineers van een bedrijf om gegevensstromen te gebruiken voor het bouwen van hun stervormig datawarehouse, inclusief feiten- en dimensietabellen in Data Lake Storage. Vervolgens wordt Power BI gebruikt om rapporten en dashboards te genereren door gegevens op te halen uit de gegevensstromen.

Image of how to build a data warehouse using dataflows.

Gegevensstromen gebruiken om een dimensional model te bouwen

U kunt gegevensstromen gebruiken als vervanging voor andere ETL-hulpprogramma's om een dimensional model te bouwen. De gegevenstechnici van een bedrijf besluiten bijvoorbeeld om gegevensstromen te gebruiken om het met stervormige schema ontworpen dimensionale model te bouwen, inclusief feiten- en dimensietabellen in Azure Data Lake Storage Gen2. Vervolgens wordt Power BI gebruikt om rapporten en dashboards te genereren door gegevens op te halen uit de gegevensstromen.

Image of how to build a dimensional model using dataflows.

Gegevensvoorbereiding centraliseren en opnieuw gebruiken van semantische modellen in meerdere Power BI-oplossingen

Als meerdere Power BI-oplossingen dezelfde getransformeerde versie van een tabel gebruiken, wordt het proces voor het maken van de tabel meerdere keren herhaald. Dit verhoogt de belasting van het bronsysteem, verbruikt meer resources en maakt dubbele gegevens met meerdere storingspunten. In plaats daarvan kan één gegevensstroom worden gemaakt om de gegevens voor alle oplossingen te berekenen. Power BI kan vervolgens het resultaat van de transformatie in alle oplossingen opnieuw gebruiken. De gegevensstroom, indien gebruikt op een dergelijke manier, kan deel uitmaken van een robuuste Power BI-implementatiearchitectuur die dubbele Power Query-code vermijdt en de onderhoudskosten van de gegevensintegratielaag verlaagt.

Image of how tables can be reused across multiple solutions.

Volgende stappen

De volgende artikelen bevatten verder studiemateriaal voor gegevensstromen.