Freigeben über


Schnellstart: Erstellen Ihres ersten Dataflow zum Abrufen und Transformieren von Daten

Dataflows sind eine cloudbasierte Self-Service-Technologie zur Datenaufbereitung. In diesem Artikel erstellen Sie Ihren ersten Dataflow, Sie rufen Daten für Ihren Dataflow ab, transformieren dann die Daten und veröffentlichen den Dataflow.

Voraussetzungen

Bevor Sie beginnen, müssen die folgenden Voraussetzungen erfüllt sein:

Erstellen eines Dataflows

In diesem Abschnitt erstellen Sie Ihren ersten Dataflow.

  1. Navigieren Sie zu Ihrem Microsoft Fabric-Arbeitsbereich.

    Screenshot: Fenster „Arbeitsbereiche“, in dem Sie zu Ihrem Arbeitsbereich navigieren

  2. Wählen Sie +Neues Element und dann "Dataflow Gen2" aus.

    Screenshot: Hervorgehobene Auswahl von „Dataflow Gen2“

Datensammlung

Nun werden wir Daten abrufen! In diesem Beispiel rufen Sie Daten von einem OData-Dienst ab. Führen Sie die folgenden Schritte aus, um Daten in Ihren Dataflow abzurufen.

  1. Wählen Sie im Dataflow-Editor die Option Daten abrufen und dann Weitere aus.

    Screenshot: Ausgewählte Option „Daten abrufen“ mit der hervorgehobenen Option „Weitere“ im Dropdownfeld

  2. Wählen Sie in Datenquelle auswählen die Option Weitere anzeigen aus.

    Screenshot von „Datenquelle abrufen“ mit „Mehr anzeigen“ hervorgehoben.

  3. Wählen Sie in Neue Quelle die Option Andere>OData als Datenquelle aus.

    Screenshot von „Datenquelle abrufen“ mit „Andere Kategorie“und „OData-Connector“ hervorgehoben.

  4. Geben Sie die URL https://services.odata.org/v4/northwind/northwind.svc/ein, und wählen Sie anschließend Weiter aus.

    Screenshot: OData-Datenquelle, wo die Daten-URL eingegeben wird

  5. Wählen Sie die Tabellen Orders und Customers und dann Erstellen aus.

    Screenshot: Power Query-Navigator mit den hervorgehobenen Tabellen „Customers“ und „Orders“

Weitere Informationen zur Datenerfassungsfunktion und -erfahrung finden Sie in der Übersicht über das Abrufen von Daten.

Anwenden von Transformationen und Veröffentlichen

Sie haben Ihre Daten in Ihren ersten Datenfluss geladen. Glückwunsch! Jetzt ist es an der Zeit, ein paar Transformationen anzuwenden, um diese Daten in das benötigte Shape zu übertragen.

Sie transformieren die Daten im Power Query-Editor. Sie finden eine detaillierte Übersicht über den Power Query-Editor auf der Power Query-Benutzeroberfläche, aber dieser Abschnitt führt Sie durch die grundlegenden Schritte:

  1. Stellen Sie sicher, dass die Datenprofilerstellungstools aktiviert sind. Wechseln Sie zu Home>Optionen>Globalen Optionen, und wählen Sie dann alle Optionen unter Spaltenprofil aus.

    Screenshot: Globale Optionen mit hervorgehobenem Bereich „Spaltenprofil“

    Stellen Sie außerdem sicher, dass Sie die Diagrammansicht mithilfe der Layoutkonfigurationen auf der Registerkarte " Ansicht " im Menüband des Power Query-Editors aktivieren oder das Diagrammansichtssymbol auf der unteren rechten Seite des Power Query-Fensters auswählen.

    Screenshot: Power Query-Diagrammansicht

  2. Berechnen Sie in der Tabelle "Bestellungen" die Gesamtanzahl der Bestellungen pro Kunde: Wählen Sie in der Datenvorschau die Spalte "CustomerID" aus, und wählen Sie dann im Menüband auf der Registerkarte "Transformieren" die Option "Gruppieren nach" aus.

    Screenshot: Die Registerkarte „Transformieren, auf der die Tabelle „Orders“ und die Option „Gruppieren nach“ hervorgehoben sind

  3. Sie führen als Aggregation in Gruppieren nach eine Zeilenzählung aus. Weitere Informationen zu den Gruppenfunktionen finden Sie in "Gruppieren" oder "Zusammenfassen von Zeilen".

    Screenshot: Bereich „Gruppieren nach“ mit der ausgewählten Operation „Zeilen zählen“

  4. Nach dem Gruppieren von Daten in der Tabelle „Orders erhalten“ wir eine zweispaltige Tabelle mit den Spalten CustomerID und Count.

    Screenshot: Zweispaltige Tabelle

  5. Als Nächstes möchten Sie Daten aus der Tabelle "Kunden" mit der Anzahl der Bestellungen pro Kunde kombinieren: Wählen Sie die Kundenabfrage in der Diagrammansicht aus, und verwenden Sie das Menü "⋮", um auf die Zusammenführungsabfragen als neue Transformation zuzugreifen.

    Screenshot: Dataflow-Editor mit der vertikalen Ellipse der Tabelle „Customers“ und der hervorgehobenen Option zum Zusammenführen von Abfragen in einer neuen Abfrage

  6. Konfigurieren Sie den Zusammenführungsvorgang , indem Sie "CustomerID " als übereinstimmende Spalte in beiden Tabellen auswählen. Wählen Sie Ok.

    Screenshot: Das Fenster „Zusammenführen“

    Screenshot des Fenster „Zusammenführen“, in dem als linke Tabelle für das Merge Zusammenführen die Tabelle „Customers“ und als rechte Tabelle für das Zusammenführen die Tabelle „Orders" festgelegt ist. Die Spalte „CustomerID“ ist sowohl für die Tabelle „Customers“ als auch die Tabelle „Orders“ ausgewählt. Außerdem ist die Verknüpfungsart auf „Linke äußere“ festgelegt. Alle anderen Optionen sind auf ihre Standardwerte festgelegt.

  7. Jetzt gibt es eine neue Abfrage mit allen Spalten aus der Tabelle "Kunden" und einer Spalte mit geschachtelten Daten aus der Tabelle "Bestellungen".

    Screenshot: Dataflows-Editor mit der neuen zusammengeführten Abfrage, die rechts neben den Tabellen „Customers“ und „Orders“ hinzugefügt wurde

  8. Konzentrieren wir uns auf nur ein paar Spalten aus der Tabelle "Kunden". Aktivieren Sie dazu die Schemaansicht, indem Sie in der unteren rechten Ecke des Datenfluss-Editors die Schaltfläche "Schemaansicht" auswählen.

    Screenshot: Dataflows-Editor mit der hervorgehobenen Schaltfläche für die Schemaansicht in der unteren rechten Ecke

  9. In der Schemaansicht werden alle Spalten in der Tabelle angezeigt. Wählen Sie CustomerID, CompanyName und Orders (2) aus. Wechseln Sie dann zur Registerkarte "Schematools ", wählen Sie "Spalten entfernen" und dann "Andere Spalten entfernen" aus. Dadurch werden nur die gewünschten Spalten beibehalten.

    Screenshot: Schemaansicht mit allen verfügbaren Spaltennamen, in der die Spalten „CustomerID“, „CompanyName“ und „Orders (2)“ hervorgehoben sind

    Screenshot: Menü mit Schematools, in dem die Option zum Entfernen anderer Spalten hervorgehoben ist

  10. Die Spalte Bestellungen (2) enthält zusätzliche Details aus dem Zusammenführungsschritt. Um diese Daten anzuzeigen und zu verwenden, wählen Sie in der unteren rechten Ecke neben "Schemaansicht anzeigen" die Schaltfläche "Datenansicht anzeigen" aus. Wählen Sie dann in der Spaltenüberschrift "Bestellungen (2) " das Symbol " Spalte erweitern" und dann die Spalte "Anzahl" aus. Dadurch wird die Auftragsanzahl für jeden Kunden zu Ihrer Tabelle hinzugefügt.

    Screenshot: Verwenden der Datenansicht

  11. Lassen Sie uns nun Ihre Kunden nach der Anzahl der Bestellungen bewerten, die sie getätigt haben. Wählen Sie die Spalte "Anzahl" aus, wechseln Sie dann zur Registerkarte " Spalte hinzufügen ", und wählen Sie "Rangspalte" aus. Dadurch wird eine neue Spalte hinzugefügt, in der die Rangfolge der einzelnen Kunden basierend auf der Auftragsanzahl angezeigt wird.

    Screenshot: Dataflows-Editor mit ausgewählter Spalte „Count“

  12. Behalten Sie die Standardeinstellungen in Spaltenrangfolge bei. Wählen Sie OK aus, um diese Transformation anzuwenden.

    Screenshot: Fenster „Rangfolge“ mit der Anzeige aller Standardeinstellungen

  13. Benennen Sie nun die resultierende Abfrage im Bereich Abfrageeinstellungen auf der rechten Seite des Bildschirms in Ranked Customers um.

    Screenshot: Dataflows-Editor mit dem unter den Abfrageeinstellungen hervorgehobenen Namen „Ranked Customers“

  14. Sie sind bereit festzulegen, wo Ihre Daten hingehen. Scrollen Sie im Bereich "Abfrageeinstellungen " nach unten, und wählen Sie "Datenziel auswählen" aus.

    Screenshot: Dataflows-Editor mit hervorgehobener Option zum Auswählen des Datenziels

  15. Sie können Ihre Ergebnisse an ein Seehaus senden, wenn Sie über einen verfügen, oder diesen Schritt überspringen, wenn sie nicht. Hier können Sie auswählen, welches Lakehouse und welche Tabelle für Ihre Daten verwendet werden. Zudem können Sie entscheiden, ob Sie neue Daten anfügen oder vorhandene ersetzen möchten.

    Screenshot des Fensters „Mit Datenziel verbinden“ mit ausgewähltem Lakehouse.

    Screenshot: Fenster zum Auswählen der Zieleinstellungen

  16. Ihr Dataflow ist jetzt bereit für die Veröffentlichung. Überprüfen Sie die Abfragen in der Diagrammansicht, und wählen Sie dann Veröffentlichen aus.

    Screenshot: Dataflows-Editor mit der hervorgehobenen Schaltfläche „Veröffentlichen“ unten rechts

    Wählen Sie " Veröffentlichen" in der unteren rechten Ecke aus, um den Datenfluss zu speichern. Sie kehren zu Ihrem Arbeitsbereich zurück, in dem ein Drehfeldsymbol neben dem Namen des Datenflusses die Veröffentlichung anzeigt. Wenn das Ladesymbol verschwindet, ist der Datenfluss bereit zu aktualisieren!

    Wichtig

    Wenn Sie zum ersten Mal einen Dataflow Gen2 in einem Arbeitsbereich erstellen, richtet Fabric einige Hintergrundelemente (Lakehouse und Warehouse) ein, die helfen, dass Ihr Dataflow ausgeführt werden kann. Diese Elemente werden von allen Datenflüssen im Arbeitsbereich genutzt, und Sie sollten sie nicht löschen. Sie sollen nicht direkt verwendet werden und sind in der Regel nicht in Ihrem Arbeitsbereich sichtbar, aber möglicherweise werden sie an anderen Stellen wie Notizbüchern oder SQL-Analysen angezeigt. Suchen Sie nach Namen, die beginnen DataflowsStaging , um sie zu erkennen.

  17. Wählen Sie in Ihrem Arbeitsbereich das Symbol Aktualisierung planen aus.

    Screenshot: Arbeitsbereich mit dem hervorgehobenen Symbol „Aktualisierung planen“

  18. Aktivieren Sie die geplante Aktualisierung, wählen Sie Weiteren Zeitpunkt hinzufügen aus, und konfigurieren Sie die Aktualisierung wie im folgenden Screenshot dargestellt.

    Screenshot: So wird ein weiterer Zeitpunkt ausgewählt

    Screenshot der Optionen für geplante Aktualisierungen, bei denen die geplante Aktualisierung aktiviert ist, die Aktualisierungshäufigkeit auf „Täglich“, die Zeitzone auf „Koordinierte Weltzeit“ und die Uhrzeit auf 4:00 Uhr festgelegt ist. Hervorgehoben sind die Schaltfläche „Ein“, die Option „Weiteren Zeitpunkt hinzufügen“, der Dataflowbesitzer und die Schaltfläche „Anwenden“.

Bereinigen von Ressourcen

Wenn Sie diesen Dataflow nicht weiterhin verwenden möchten, löschen Sie ihn mit folgenden Schritten:

  1. Navigieren Sie zu Ihrem Microsoft Fabric-Arbeitsbereich.

    Screenshot: Fenster „Arbeitsbereiche“, in dem Sie zu Ihrem Arbeitsbereich navigieren

  2. Wählen Sie die vertikalen Auslassungspunkte neben dem Namen Ihres Dataflows und dann Löschen aus.

    Screenshot: Drei vertikale Punkte und die hervorgehobene Option „Löschen“ im Dropdownmenü

  3. Wählen Sie Löschen aus, um die Löschung des Dataflows zu bestätigen.

    Screenshot: Fenster „Dataflow löschen“ mit hervorgehobener Schaltfläche „Löschen“

Der Dataflow in diesem Beispiel zeigt, wie Sie Daten in Dataflow „Gen2“ laden und transformieren. Sie haben Folgendes gelernt:

  • Erstellen Sie einen Dataflow „Gen2“.
  • Transformieren von Daten.
  • Konfigurieren Sie Zieleinstellungen für transformierte Daten.
  • Führen Sie Ihre Datenpipeline aus, und planen Sie sie.

Fahren Sie mit dem nächsten Artikel fort, um mehr über das Erstellen einer Datenpipeline zu erfahren.