Gegevensstromen Gen2 verkennen in Microsoft Fabric

Voltooid

In Microsoft Fabric kunt u een Dataflow Gen2 maken in de Data Factory-workload of Power BI-werkruimte, of rechtstreeks in het lakehouse. Omdat ons scenario is gericht op gegevensopname, gaan we kijken naar de data factory-workloadervaring . Gegevensstromen Gen2 gebruiken Power Query Online om transformaties te visualiseren. Bekijk een overzicht van de interface:

Schermopname van de Power Query Online-interface.

1. Power Query-lint

Gegevensstromen Gen2 ondersteunen een groot aantal connectors voor gegevensbronnen. Veelvoorkomende bronnen zijn cloud- en on-premises relationele databases, Excel- of platte bestanden, SharePoint, SalesForce, Spark en Fabric Lakehouses. Vervolgens zijn er talloze gegevenstransformaties mogelijk, zoals:

  • Rijen filteren en sorteren
  • Draaitabel en draaitabel opheffen
  • Query's samenvoegen en toevoegen
  • Splitsen en voorwaardelijke splitsing
  • Waarden vervangen en duplicaten verwijderen
  • Kolommen toevoegen, naam wijzigen, opnieuw ordenen of verwijderen
  • Calculator voor rangschikken en percentage
  • Kies Bovenste N en Onderste N

U kunt ook gegevensbronverbindingen maken en beheren, parameters beheren en de standaardgegevensbestemming op dit lint configureren.

2. Deelvenster Query's

In het deelvenster Query's ziet u de verschillende gegevensbronnen, nu query's genoemd. Deze query's worden tabellen genoemd wanneer ze in uw gegevensarchief worden geladen. U kunt een query dupliceren of ernaar verwijzen als u meerdere kopieën van dezelfde gegevens nodig hebt, zoals het maken van een stervormig schema en het splitsen van gegevens in afzonderlijke, kleinere tabellen. U kunt ook de belasting van een query uitschakelen, voor het geval u alleen de eenmalige import nodig hebt.

3. Diagramweergave

In de diagramweergave kunt u visueel zien hoe de gegevensbronnen zijn verbonden en de verschillende toegepaste transformaties. Uw gegevensstroom maakt bijvoorbeeld verbinding met een gegevensbron, dupliceerde de query, verwijdert kolommen uit de bronquery en maakt vervolgens de dubbele query ongedaan. Elke query wordt weergegeven als een shape met alle toegepaste transformaties en verbonden door een lijn voor de dubbele query. U kunt deze weergave in- of uitschakelen.

4. Deelvenster Gegevensvoorbeeld

In het deelvenster Gegevensvoorbeeld wordt alleen een subset met gegevens weergegeven, zodat u kunt zien welke transformaties u moet maken en hoe deze van invloed zijn op de gegevens. U kunt ook communiceren met het voorbeeldvenster door kolommen te slepen en neer te zetten om de volgorde te wijzigen of door met de rechtermuisknop op kolommen te klikken om te filteren of wijzigingen aan te brengen. In het voorbeeld van de gegevens worden al uw transformaties voor de geselecteerde query weergegeven.

5. Deelvenster Queryinstellingen

Het deelvenster Queryinstellingen bevat de toegepaste stappen. Elke transformatie wordt weergegeven als een stap, waarvan sommige automatisch worden toegepast wanneer u de gegevensbron verbindt. Afhankelijk van de complexiteit van de transformaties, hebt u mogelijk verschillende toegepaste stappen voor elke query. De meeste stappen hebben een tandwielpictogram waarmee u de stap kunt wijzigen, anders moet u de transformatie verwijderen en herhalen.

Elke stap heeft ook een contextmenu wanneer u met de rechtermuisknop klikt, zodat u de stappen kunt wijzigen, opnieuw ordenen of verwijderen. U kunt ook de gegevensbronquery bekijken wanneer u verbinding maakt met een gegevensbron die ondersteuning biedt voor het vouwen van query's.

Hoewel deze visuele interface nuttig is, kunt u de M-code ook bekijken via geavanceerde editor.

Schermopname van de geavanceerde editor met voorbeeldcode

In het deelvenster Query-instellingen ziet u een optie Gegevensbestemming om uw gegevens op een van de volgende locaties in uw Fabric-omgeving te plaatsen:

  • Lakehouse
  • Magazijn
  • SQL-database

U kunt uw gegevensstroom ook laden in Azure SQL Database, Azure Data Explorer of Azure Synapse Analytics.

Gegevensstromen Gen2 bieden een oplossing met weinig tot geen code voor het opnemen, transformeren en laden van gegevens in uw Fabric-gegevensarchieven. Power BI-ontwikkelaars zijn bekend en kunnen snel transformaties upstream uitvoeren om de prestaties voor hun rapporten te verbeteren.

Notitie

Zie de Power Query-documentatie voor het optimaliseren van uw gegevensstromen voor meer informatie.