Dataflows sind eine cloudbasierte Self-Service-Technologie zur Datenaufbereitung. Dataflows ermöglichen Kunden die Aufnahme, Umwandlung und das Laden von Daten in Microsoft Dataverse-Umgebungen, Power BI-Arbeitsbereiche oder das Azure Data Lake Storage-Konto Ihres Unternehmens. Dataflows werden mithilfe von Power Query erstellt, einer einheitlichen Oberfläche zur Datenkonnektivität und -vorbereitung, die bereits in vielen Microsoft-Produkten einschließlich Excel und Power BI enthalten ist. Die Kunden können Dataflows entweder nach Bedarf oder automatisch nach einem Zeitplan ablaufen lassen; die Daten sind immer auf dem neuesten Stand.
Dataflows können in mehreren Microsoft-Produkten erstellt werden
Dataflows sind in mehreren Microsoft-Produkten enthalten und erfordern keine Dataflow-spezifische Lizenz, um erstellt oder ausgeführt zu werden. Dataflows sind in Power Apps, Power BI und Dynamics 365 Customer Insights verfügbar. Die Möglichkeit, Dataflows zu erstellen und auszuführen, ist in den Lizenzen dieser Produkte enthalten. Die meisten Dataflow-Funktionen sind in allen Produkten, in denen sie enthalten sind, gleich, aber einige produktspezifische Funktionen können in Dataflows vorhanden sein, die in einem Produkt erstellt wurden, nicht aber in einem anderen.
Wie funktioniert der Dataflow?
Die vorherige Abbildung zeigt eine Gesamtübersicht über die Definition eines Dataflows. Ein Dataflow bezieht Daten aus verschiedenen Datenquellen (mehr als 80 Datenquellen werden bereits unterstützt). Auf der Grundlage der mit der Power Query Authoring Experience konfigurierten Transformationen transformiert der Dataflow dann die Daten mit Hilfe der Dataflow-Engine. Schließlich werden die Daten in das Ausgabeziel geladen, bei dem es sich um eine Microsoft Power Platform-Umgebung, einen Power BI-Arbeitsbereich oder das Azure Data Lake Storage-Konto des Unternehmens handeln kann.
Dataflows laufen in der Cloud
Dataflows sind Cloud-basiert. Wenn ein Dataflow erstellt und gespeichert wird, wird seine Definition in der Cloud gespeichert. Ein Dataflow läuft auch in der Cloud. Handelt es sich jedoch um eine lokale Datenquelle, kann ein lokales Daten-Gateway verwendet werden, um die Daten in die Cloud zu extrahieren. Wenn ein Dataflowlauf ausgelöst wird, findet die Datenumwandlung und -berechnung in der Cloud statt, und das Ziel befindet sich immer in der Cloud.
Dataflows verwenden eine leistungsstarke Transformations-Engine
Power Query ist die Datenumwandlungsmaschine, die im Dataflow verwendet wird. Dieser Motor ist fähig genug, um viele fortgeschrittene Transformationen zu unterstützen. Außerdem verwendet es eine einfache, aber leistungsstarke grafische Benutzeroberfläche namens Power Query Editor. Sie können mit diesem Editor Dataflows verwenden, um Ihre Datenintegrationslösungen schneller und einfacher zu entwickeln.
Dataflowintegration mit Microsoft Power Platform und Dynamics 365
Da ein Dataflow die resultierenden Tabellen in einem Cloud-basierten Speicher speichert, können andere Dienste mit den von Dataflows erzeugten Daten interagieren.
Beispielsweise können Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- und Dynamics 365-Anwendungen die vom Dataflow erzeugten Daten abrufen, indem sie eine Verbindung mit Dataverse, einem Power Platform-Dataflowconnector oder direkt über den Lake herstellen, je nachdem, wo das Ziel zur Erstellungszeit des Dataflows konfiguriert wurde.
Vorteile von Dataflows
In der folgenden Liste werden einige der Vorteile der Verwendung von Dataflows hervorgehoben:
Ein Dataflow entkoppelt die Datentransformationsebene von der Modellierungs- und Visualisierungsebene in einer Power BI-Lösung.
Der Datentransformationscode kann sich an einem zentralen Ort befinden, in einem Dataflow, anstatt auf mehrere Artefakte verteilt zu werden.
Ein Dataflowersteller benötigt nur Power Query-Fähigkeiten. In einer Umgebung mit mehreren Erstellern kann der Dataflowersteller Teil eines Teams sein, das zusammen die gesamte BI-Lösung oder betriebsbereite Anwendung erstellt.
Ein Dataflow ist produktunabhängig. Es ist nicht nur eine Komponente von Power BI; Sie können die Daten auch in anderen Tools und Diensten abrufen.
Dataflows profitieren von Power Query, einer leistungsstarken grafischen Self-Service-Oberfläche zur Datentransformation.
Dataflows werden vollständig in der Cloud ausgeführt. Es ist keine zusätzliche Infrastruktur erforderlich.
Sie haben mehrere Optionen, die Arbeit mit Dataflows zu beginnen, indem Sie Lizenzen für Power Apps, Power BI und Customer Insights verwenden.
Obwohl Dataflows zu fortgeschrittenen Transformationen fähig sind, sind sie für Self-Service-Szenarien konzipiert und erfordern keinen IT- oder Entwicklerhintergrund.
Anwendungsszenarien für Dataflows
Sie können Dataflows für viele Zwecke verwenden. Die folgenden Szenarien bieten einige Beispiele für häufige Anwendungsfälle von Dataflows.
Datenmigration von Altsystemen
In diesem Szenario hat sich ein Unternehmen entschieden, Power Apps für die neue Benutzeroberfläche zu verwenden und nicht das alte System vor Ort. Power Apps, Power Automate und AI Builder verwenden alle Dataverse als primäres Datenspeichersystem. Die aktuellen Daten im vorhandenen lokalen System können mit Hilfe eines Dataflows in Dataverse migriert werden, und dann können diese Produkte diese Daten nutzen.
Verwendung von Dataflows zum Aufbau eines Data Warehouse
Sie können Dataflows als Ersatz für andere Extraktions-, Transformations- und Ladetools (ETL) verwenden, um ein Data Warehouse aufzubauen. In diesem Szenario entscheiden sich die Dateningenieure eines Unternehmens für die Verwendung von Dataflows, um ihr nach einem Sternschema entworfenes Data Warehouse mit Fakten- und Dimensionstabellen in Data Lake Storage aufzubauen. Dann wird Power BI verwendet, um Berichte und Dashboards zu erstellen, indem Daten aus den Dataflows abgerufen werden.
Verwendung von Dataflows zum Aufbau eines dimensionalen Modells
Sie können Dataflows als Ersatz für andere ETL-Tools verwenden, um ein Dimensionsmodell zu erstellen. Die Dateningenieure eines Unternehmens entscheiden sich beispielsweise für die Verwendung von Dataflows, um das in einem Sternschema entworfene Dimensionsmodell einschließlich Fakten- und Dimensionstabellen in Azure Data Lake Storage Gen2 zu erstellen. Dann wird Power BI verwendet, um Berichte und Dashboards zu erstellen, indem Daten aus den Dataflows abgerufen werden.
Zentralisierung der Datenaufbereitung und Wiederverwendung von semantischen Modellen über mehrere Power BI-Lösungen hinweg
Wenn mehrere Power BI-Lösungen dieselbe transformierte Version einer Tabelle verwenden, wird der Prozess zur Erstellung der Tabelle mehrfach wiederholt. Dies erhöht die Belastung des Quellsystems, verbraucht mehr Ressourcen und erzeugt doppelte Daten mit mehreren Fehlerpunkten. Stattdessen kann ein einziger Dataflow erstellt werden, um die Daten für alle Lösungen zu berechnen. Power BI kann dann das Ergebnis der Transformation in allen Lösungen wiederverwenden. Der Dataflow kann, wenn er auf diese Weise verwendet wird, Teil einer robusten Power BI-Implementierungsarchitektur sein, die Power Query-Code-Duplikate vermeidet und die Wartungskosten der Datenintegrationsschicht reduziert.
Nächste Schritte
Die folgenden Artikel bieten weiteres Studienmaterial für Dataflows.
Erstellen einer Power BI-Transformationslogik für die Wiederverwendung in Ihrer Organisation mit Power BI-Dataflows Hier erfahren Sie, wie Sie Power BI-Dataflows mit Power BI Premium für skalierbare ETL-Vorgänge (Extrahieren, Transformieren und Laden) kombinieren und das Erstellen und Verwenden von Dataflows üben.
Zeigen Sie Ihre Kenntnisse von allgemeinen Datentechnikaufgaben zum Implementieren und Verwalten von Datentechnikworkloads in Microsoft Azure unter Verwendung verschiedener Azure-Dienste.