Teilen über


Schnellstart: Erstellen eines Datenworkflows

Hinweis

Datenworkflows werden von Apache Airflow unterstützt.
Apache Airflow ist eine Open-Source-Plattform, die zum programmgesteuerten Erstellen, Planen und Überwachen komplexer Datenworkflows verwendet wird. Es ermöglicht Ihnen, eine Reihe von Aufgaben zu definieren, die als Operatoren bezeichnet werden und zu gerichteten azyklischen Graphen (Directed Acyclic Graphs, DAGs) kombiniert werden können, um Datenpipelines darzustellen.

Datenworkflows sind ein einfacher und effizienter Weg, um Apache Airflow-Umgebungen zu erstellen und zu verwalten, so dass Sie Ihre Daten-Workflows in großem Umfang problemlos ausführen können. In dieser Schnellstartanleitung erstellen Sie Ihren ersten Datenworkflow und führen ein zyklisches Diagramm (Directed Acyclic Graph, DAG) aus, um sich mit der Umgebung und den Funktionen von Datenworkflows vertraut zu machen.

Voraussetzungen

  • Aktivieren Sie Datenworkflows in Ihrem Mandanten.

Hinweis

Da sich Datenworkflows im Vorschauzustand befinden, müssen Sie sie über Ihren Mandantenadministrator aktivieren. Wenn Datenworkflows bereits angezeigt werden, hat Ihr Mandantenadministrator ihn möglicherweise bereits aktiviert.

  1. Wechseln Sie zum Verwaltungsportal –> Mandanten-Einstellungen –> Erweitern Sie unter Microsoft Fabric –> den Abschnitt „Benutzer können Datenworkflows erstellen und verwenden (Vorschau)“.
  2. Wählen Sie Übernehmen.

Screenshot zum Aktivieren von Apache Airflow im Mandanten.

Erstellen eines Datenworkflows

  1. Sie können einen vorhandenen Arbeitsbereich verwenden oder einen Neuen Arbeitsbereich erstellen.

  2. + New Dropdown erweitern – > Klicken Sie auf Weitere Optionen –> Unter Abschnitt Data Factory –> Auswählen von Datenworkflows (Vorschau)

    Screenshot zeigt Klicken Sie auf mehr Optionen.

    Screenshot zum Auswählen des Datenworkflows.

  3. Geben Sie Ihrem Projekt einen geeigneten Namen und klicken Sie auf die Schaltfläche Erstellen.

Erstellen einer DAG-Datei

  1. Klicken Sie auf die Karte Neue DAG-Datei – > geben Sie der Datei den Namen, und klicken Sie auf die Schaltfläche Erstellen.

    Screenshot zum Benennen der DAG-Datei.

  2. Ihnen wird ein DAG-Code mit Textbausteinen angezeigt. Sie können die Datei nach Ihren Wünschen bearbeiten.

    Der Screenshot zeigt eine Standard-DAG-Datei in Microsoft Fabric.

  3. Klicken Sie auf das Symbol „Speichern“.

    Screenshot zeigt, wie die DAG-Datei in Microsoft Fabric gespeichert wird.

Ausführen einer DAG

  1. Klicken Sie zunächst auf die Schaltfläche DAG ausführen.

    Screenshot zum Ausführen der DAG aus der Benutzeroberfläche von Datenworkflows.

  2. Nach dem Initiieren wird eine Benachrichtigung angezeigt, die angibt, dass die DAG ausgeführt wird.

  3. Um den Fortschritt der DAG-Ausführung zu überwachen, klicken Sie einfach im Benachrichtigungscenter auf Details anzeigen. Diese Aktion leitet Sie zur Apache Airflow UI um, wo Sie bequem den Status und Details der DAG-Ausführung nachverfolgen können.

    Screenshot zum Navigieren zur Apache Airflow-Benutzeroberfläche über das Benachrichtigungscenter.

Überwachen des Datenworkflow-DAG in der Apache Airflow-Benutzeroberfläche

Die gespeicherten Dag-Dateien werden in der Apache Airflow-Benutzeroberfläche geladen. Sie können sie überwachen, indem Sie auf die Schaltfläche „In Apache Airflow überwachen“ klicken.

Screenshot zum Überwachen der Airflow-DAG.

Der Screenshot zeigt die geladene Airflow-DAG.