教程:在数据工作流中运行 Hello-world DAG

注意

数据工作流由 Apache Airflow 提供支持。
Apache Airflow 是一个开放源代码平台,用于以编程方式创建、计划和监视复杂的数据工作流。 它允许定义一组称为运算器的任务,这些任务可以组合成有向无环图 (DAG) 以表示数据管道。

在本教程中,你将在数据工作流中运行一个 hello-world DAG。 本教程重点介绍如何让用户熟悉数据工作流的功能和环境。

先决条件

若要开始,必须满足以下先决条件:

  • 在租户中启用数据工作流。

    注意

    由于数据工作流处于预览状态,因此需要通过租户管理员启用它。如果已看到“数据工作流”,则租户管理员可能已启用它。

    1. 转到管理员门户 -> 租户设置 -> 在 Microsoft Fabric 下 -> 展开“用户可以创建和使用数据工作流(预览版)”部分。

    2. 单击“应用”。

      在租户中启用 Apache Airflow 的屏幕截图。

创建数据工作流

  1. 可使用现有工作区或创建新工作区

  2. 展开 + New 下拉列表 -> 单击“更多选项 - Data Factory 部分下的 > -> 选择数据工作流(预览版)

    屏幕截图显示点击更多选项。

    选择数据工作流的屏幕截图。

  3. 给项目起一个名字,然后点击“创建”按钮。

创建 DAG 文件

  1. 单击“新建DAG文件”卡 - > 为文件命名,然后单击“创建”按钮。

    命名 DAG 文件的屏幕截图。

  2. 将向你显示样本 DAG 代码。 可根据要求编辑文件。

    显示了 Microsoft Fabric 中的样本 DAG 文件的屏幕截图。

  3. 单击“保存”图标。

    显示如何在 Microsoft Fabric 中保存 DAG 文件的屏幕截图。

在 Apache Airflow UI 中监视数据工作流 DAG

  1. 保存的 DAG 文件将加载到 Apache Airflow UI 中。 可以通过单击“Apache Airflow 中的监视器”按钮来监视它们。

    监视 Airflow DAG 的屏幕截图。

    屏幕截图显示了加载的 Airflow DAG。

快速入门:创建数据工作流