Wat zijn gegevensstromen?

Gegevensstromen zijn een selfservicetechnologie voor gegevensvoorbereiding in de cloud. Met gegevensstromen kunnen klanten gegevens opnemen, transformeren en laden in Microsoft Dataverse-omgevingen, Power BI werkruimten of het Azure Data Lake Storage-account van uw organisatie. Gegevensstromen worden geschreven met behulp van Power Query, een uniforme ervaring voor gegevensconnectiviteit en voorbereiding die al in veel Microsoft-producten wordt aanbevolen, waaronder Excel en Power BI. Klanten kunnen gegevensstromen activeren om op aanvraag of automatisch volgens een schema uit te voeren; gegevens worden altijd up-to-date gehouden.

Gegevensstromen kunnen worden gemaakt in meerdere Microsoft-producten

Gegevensstromen worden weergegeven in meerdere Microsoft-producten en vereisen geen licentie voor een gegevensstroom die specifiek is voor het maken of uitvoeren van gegevensstromen. Gegevensstromen zijn beschikbaar in Power Apps, Power BI en Dynamics 365-Customer Insights. De mogelijkheid om gegevensstromen te maken en uit te voeren, wordt gebundeld met de licenties van deze producten. Gegevensstroomfuncties zijn meestal gebruikelijk voor alle producten waarin ze worden weergegeven, maar sommige productspecifieke functies kunnen bestaan in gegevensstromen die in het ene product zijn gemaakt versus een ander product.

Hoe werkt de gegevensstroom?

How do dataflows function.

In de vorige afbeelding ziet u een algemeen overzicht van de wijze waarop een gegevensstroom wordt gedefinieerd. Een gegevensstroom haalt gegevens op uit verschillende gegevensbronnen (meer dan 80 gegevensbronnen worden al ondersteund). Vervolgens, op basis van de transformaties die zijn geconfigureerd met de Power Query ontwerpervaring, transformeert de gegevensstroom de gegevens met behulp van de gegevensstroomengine. Ten slotte worden de gegevens geladen naar de uitvoerbestemming. Dit kan een Microsoft Power Platform-omgeving, een Power BI werkruimte of het Azure Data Lake Storage-account van de organisatie zijn.

Gegevensstromen worden uitgevoerd in de cloud

Gegevensstromen zijn gebaseerd op de cloud. Wanneer een gegevensstroom is gemaakt en opgeslagen, wordt de definitie ervan opgeslagen in de cloud. Een gegevensstroom wordt ook uitgevoerd in de cloud. Als een gegevensbron echter on-premises is, kan een on-premises gegevensgateway worden gebruikt om de gegevens naar de cloud te extraheren. Wanneer een gegevensstroomuitvoering wordt geactiveerd, vindt de gegevenstransformatie en berekening plaats in de cloud en bevindt de bestemming zich altijd in de cloud.

Dataflows run in the cloud.

Gegevensstromen gebruiken een krachtige transformatie-engine

Power Query is de engine voor gegevenstransformatie die wordt gebruikt in de gegevensstroom. Deze engine is geschikt voor veel geavanceerde transformaties. Het maakt ook gebruik van een eenvoudige, maar krachtige, grafische gebruikersinterface genaamd Power Query-editor. U kunt gegevensstromen met deze editor gebruiken om uw oplossingen voor gegevensintegratie sneller en eenvoudiger te ontwikkelen.

Power Query transformations.

Integratie van gegevensstromen met Microsoft Power Platform en Dynamics 365

Omdat een gegevensstroom de resulterende entiteiten opslaat in cloudopslag, kunnen andere services communiceren met de gegevens die worden geproduceerd door gegevensstromen.

Dataflow integration with Microsoft Power Platform and Dynamics 365.

Zo kunnen Power BI- Power Apps-, Power Automate-, Power Virtual Agents- en Dynamics 365-toepassingen de gegevens ophalen die door de gegevensstroom worden geproduceerd door verbinding te maken met Dataverse, een Power Platform-gegevensstroomconnector of rechtstreeks via het lake, afhankelijk van het doel dat is geconfigureerd tijdens het maken van de gegevensstroom.

Voordelen van gegevensstromen

In de volgende lijst ziet u enkele voordelen van het gebruik van gegevensstromen:

  • Een gegevensstroom koppelt de gegevenstransformatielaag los van de modellerings- en visualisatielaag in een Power BI oplossing.

  • De code voor gegevenstransformatie kan zich op een centrale locatie bevinden, een gegevensstroom, in plaats van te worden verdeeld over meerdere artefacten.

  • Een maker van een gegevensstroom heeft alleen Power Query vaardigheden nodig. In een omgeving met meerdere makers kan de maker van de gegevensstroom deel uitmaken van een team dat samen de volledige BI-oplossing of operationele toepassing bouwt.

  • Een gegevensstroom is productneutraal. Het is geen onderdeel van Power BI alleen; u kunt de gegevens ophalen in andere hulpprogramma's en services.

  • Gegevensstromen profiteren van Power Query, een krachtige, grafische, selfservice voor gegevenstransformatie.

  • Gegevensstromen worden volledig uitgevoerd in de cloud. Er is geen extra infrastructuur vereist.

  • U hebt meerdere opties voor het werken met gegevensstromen, het gebruik van licenties voor Power Apps, Power BI en Customer Insights.

  • Hoewel gegevensstromen geschikt zijn voor geavanceerde transformaties, zijn ze ontworpen voor selfservicescenario's en hebben ze geen IT- of ontwikkelaarsachtergrond nodig.

Use-casescenario's voor gegevensstromen

U kunt gegevensstromen gebruiken voor veel doeleinden. De volgende scenario's bevatten enkele voorbeelden van veelvoorkomende use cases voor gegevensstromen.

Gegevensmigratie van verouderde systemen

In dit scenario is de beslissing genomen door een organisatie om Power Apps te gebruiken voor de nieuwe gebruikersinterface-ervaring in plaats van het verouderde on-premises systeem. Power Apps, Power Automate en AI Builder gebruiken allemaal Dataverse als het primaire systeem voor gegevensopslag. De huidige gegevens in het bestaande on-premises systeem kunnen worden gemigreerd naar Dataverse met behulp van een gegevensstroom en vervolgens kunnen deze producten die gegevens gebruiken.

Gegevensstromen gebruiken om een datawarehouse te bouwen

U kunt gegevensstromen gebruiken als vervanging voor andere ETL-hulpprogramma's (extract, transform, load) om een datawarehouse te bouwen. In dit scenario besluiten de data engineers van een bedrijf gegevensstromen te gebruiken om hun stervormig datawarehouse te bouwen, inclusief feiten- en dimensietabellen in Data Lake Storage. Vervolgens wordt Power BI gebruikt om rapporten en dashboards te genereren door gegevens op te halen uit de gegevensstromen.

Building a data warehouse by using dataflows.

Gegevensstromen gebruiken om een dimensional model te bouwen

U kunt gegevensstromen gebruiken als vervanging voor andere ETL-hulpprogramma's om een dimensional model te bouwen. De gegevenstechnici van een bedrijf besluiten bijvoorbeeld gegevensstromen te gebruiken om het stervormig schema ontworpen dimensionale model te bouwen, inclusief feiten- en dimensietabellen in Azure Data Lake Storage Gen2. Vervolgens wordt Power BI gebruikt om rapporten en dashboards te genereren door gegevens op te halen uit de gegevensstromen.

Building a dimensional model using dataflows.

Gegevensvoorbereiding centraliseren en opnieuw gebruiken van gegevenssets in meerdere Power BI oplossingen

Als meerdere Power BI oplossingen dezelfde getransformeerde versie van een tabel gebruiken, wordt het proces voor het maken van de tabel meerdere keren herhaald. Dit verhoogt de belasting van het bronsysteem, verbruikt meer resources en maakt dubbele gegevens met meerdere storingspunten. In plaats daarvan kan één gegevensstroom worden gemaakt om de gegevens voor alle oplossingen te berekenen. Power BI vervolgens het resultaat van de transformatie in alle oplossingen opnieuw kan gebruiken. De gegevensstroom, indien gebruikt op een dergelijke manier, kan deel uitmaken van een robuuste Power BI implementatiearchitectuur die de Power Query code dupliceert en de onderhoudskosten van de gegevensintegratielaag vermindert.

Re-use of tables across multiple solutions.

Volgende stappen

De volgende artikelen bevatten verder studiemateriaal voor gegevensstromen.