你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Azure Blob 存储导入 DAG

注意

此功能目前以公共预览版提供。 工作流编排管理器由 Apache Airflow 提供支持。

本文介绍了如何使用 Azure Blob 存储将有向无环图 (DAG) 导入工作流编排管理器的分步说明。

先决条件

预览版期间不支持虚拟网络后面的 Blob 存储。 storageLinkedServices 中的 Azure Key Vault 配置不支持导入 DAG。

导入 DAG

  1. 根据设置的 Airflow 环境复制示例 Apache Airflow v2.x DAG 或示例 Apache Airflow v1.10 DAG。 将内容粘贴到名为 tutorial.py 的新文件中

    将 tutorial.py 文件上传到 Blob 存储。 有关详细信息,请参阅将文件上传到 blob

    注意

    需要从包含 dags 和 plugins 文件夹的 Blob 存储帐户中选择一个目录路径,以将其导入 Airflow 环境。 插件不是必需的。 还可以有一个名为 dags 的容器,并上传其中的所有 Airflow 文件。

  2. 在“管理中心”下,选择“Apache Airflow”。 然后,将鼠标悬停在先前创建的“Airflow”环境上并选择“导入文件”以将所有 DAG 和依赖项导入 Airflow 环境

    屏幕截图显示在管理中心导入文件。

  3. 为先决条件中提到的可访问存储帐户新建一个链接服务。 如果已有自己的 DAG,也可以使用现有 DAG。

    显示如何创建新链接服务的屏幕截图。

  4. 使用上传 DAG 的存储帐户。 (查看“先决条件”部分。)测试连接,然后选择“创建”

    屏幕截图显示一些链接服务详细信息。

  5. 如果使用示例 SAS URL,请浏览并选择“airflow”。 还可以选择包含 DAG 文件的 dags 文件夹所在的文件夹

    注意

    可以通过此接口导入 DAG 及其依赖项。 需要从包含 dags 和 plugins 文件夹的 Blob 存储帐户中选择一个目录路径,以将其导入 Airflow 环境。 插件不是必需的。

    屏幕截图显示“导入文件”屏幕上的“浏览存储”按钮。

    屏幕截图显示“浏览”上的 airflow 根文件夹。

  6. 选择“导入”以导入文件

    屏幕截图显示“导入文件”屏幕上的“导入”按钮。

    屏幕截图显示导入 DAG。

在预览版期间导入 DAG 可能需要几分钟时间。 可以使用通知中心(数据工厂 UI 中的钟形图标)跟踪导入状态更新。