连接 Azure Data Lake Storage Gen2 以存储数据流

你可以配置数据流以将其数据存储到组织的 Azure Data Lake Storage Gen2 帐户中。 本文介绍执行此操作所需的一般步骤,并在此过程中提供指导和最佳做法。

重要

具有分析表功能的数据流使用 Azure Synapse Link for Dataverse 服务,该服务可提供不同级别的合规性、隐私、安全性和数据位置承诺。 有关 Azure Synapse Link for Dataverse 的详细信息,请转到什么是 Azure Synapse Link for Dataverse?

配置数据流以在数据湖中存储其定义和数据文件有一些优点,例如:

  • Azure Data Lake Storage Gen2 可为数据提供缩放性极强的存储设施。
  • IT 部门的开发人员可以使用数据流数据和定义文件来利用 Azure 数据和人工智能 (AI) 服务,如 Azure 数据服务的 GitHub 示例中所示。
  • 通过它,组织中的开发人员能够使用数据流和 Azure 的开发人员资源,将数据流数据集成到内部应用程序和业务线解决方案中。

要求

若要将 Azure Data Lake Storage Gen2 用于数据流,需要以下各项:

  • Power Apps 环境。 任何 Power Apps 计划都允许使用 Azure Data Lake Storage Gen2 作为目标来创建数据流。 你需要作为制作者在环境中获得授权。
  • Azure 订阅。 你需要 Azure 订阅才能使用 Azure Data Lake Storage Gen2。
  • 资源组。 使用已经具有的资源组,也可以创建新组。
  • 一个 Azure 存储帐户。 必须为存储帐户启用 Data Lake Storage Gen2 功能。

提示

如果你还没有 Azure 订阅,请在开始之前创建一个免费试用帐户

为 Power Platform 数据流准备 Azure Data Lake Storage Gen2

在使用 Azure Data Lake Storage Gen2 帐户配置环境之前,必须创建和配置一个存储帐户。 以下是 Power Platform 数据流的要求:

  1. 必须在与 Power Apps 租户相同的 Microsoft Entra ID 租户中创建存储帐户。
  2. 建议在计划在其中使用存储帐户的 Power Apps 环境所在的同一区域中创建存储帐户。 若要确定 Power Apps 环境的位置,请联系你的环境管理员。
  3. 必须为存储帐户启用分层命名空间功能。
  4. 你必须被授予存储帐户“所有者”角色。

以下部分演练配置 Azure Data Lake Storage Gen2 帐户所需的步骤。

创建存储帐户

执行创建 Azure Data Lake Storage Gen2 存储帐户中的步骤。

  1. 确保选择与环境相同的区域,并将存储设置为 StorageV2(常规用途 v2)。
  2. 确保启用分层命名空间功能。
  3. 我们建议将复制设置设为读取访问异地冗余存储 (RA-GRS)。

将 Azure Data Lake Storage Gen2 连接到 Power Apps

在 Azure 门户中设置了 Azure Data Lake Storage Gen2 帐户后,即可将其连接到特定的数据流或 Power Apps 环境。 通过将湖连接到环境,可允许环境中的其他制作者和管理员创建数据流,以将数据也存储在组织的湖中。

要将 Azure Data Lake Storage Gen2 帐户与数据流连接,请执行以下步骤:

  1. 登录到 Power Apps,并验证你所在的具体环境。 环境切换器位于标头的右侧。

  2. 在左侧导航窗格上,选择数据旁边的向下箭头。

    Power Apps 制作者门户“数据”选项卡。

  3. 在显示的列表中,选择数据流,然后在命令栏上选择新建数据流

    创建新数据流。

  4. 选择所需的分析表。 这些表指明要在组织的 Azure Data Lake Store Gen2 帐户中存储的具体数据。

    选择分析表。

选择要用于数据流存储的存储帐户

如果存储帐户尚未与环境关联,则会显示链接到数据湖对话框。 你需要登录并查找在前面的步骤中创建的数据湖。 在此示例中,没有数据湖与环境关联,因此会出现一个添加数据湖的提示。

  1. 选择存储帐户。

    此时将显示选择存储帐户屏幕。

    选择存储帐户。

  2. 选择存储帐户的订阅 ID

  3. 选择在其中创建了存储帐户的资源组名称

  4. 输入存储帐户名称

  5. 选择保存

成功完成这些步骤后,你的 Azure Data Lake Storage Gen2 帐户会连接到 Power Platform 数据流,你可以继续创建数据流。

注意事项和限制

使用数据流存储时,需要牢记一些注意事项和限制:

  • 默认环境中不支持链接用于数据流存储的 Azure Data Lake Store Gen2 帐户。
  • 为数据流配置数据流存储位置后,无法更改此位置。
  • 链接存储帐户后,不支持更改环境的名称,并且链接到该存储帐户的数据流将失败。 改回环境名称后,将重新启用这些数据流。
  • 默认情况下,任何环境成员都可以使用 Power Platform 数据流连接器访问数据流数据。 但是,只有数据流所有者才能直接在 Azure Data Lake Storage Gen2 中访问其文件。 要授权更多人直接在湖中访问数据流数据,必须授权他们在数据湖中访问数据流的 CDM 文件夹或访问数据湖本身。
  • 删除数据流时,也将删除湖中该数据流的 CDM 文件夹
  • 不支持在不同存储类型(自带存储帐户 (BYOSA) 和内部存储)的两个工作区之间尝试连接两个数据流表。

重要

你不应更改组织湖中数据流创建的文件或将文件添加到数据流的 CDM 文件夹。 更改文件可能会损坏数据流或更改其行为,并且不支持更改文件。 Power Platform 数据流仅授予对它在湖中创建的文件的读取访问权限。 如果授权其他人或服务访问 Power Platform 数据流使用的文件系统,则仅授予他们对该文件系统中的文件或文件夹的读取访问权限。

隐私声明

如果允许在组织中通过 Azure Synapse Link for Dataverse 服务使用分析表来创建数据流,则有关 Azure Data Lake 存储帐户的详细信息(例如存储帐户的名称)将发送到 Azure Synapse Link for Dataverse 服务并存储在其中,该服务目前位于 PowerApps 合规性边界之外,其采用的隐私和安全措施通常可能比 PowerApps 采用的少或与之不同。 请注意,你可以随时删除数据湖关联以停用此功能,系统将从 Azure Synapse Link for Dataverse 服务中删除 Azure Data Lake 存储帐户详细信息。 本文中提供了有关 Azure Synapse Link for Dataverse 的详细信息。

常见问题解答

如果我以前在组织的 Azure Data Lake Storage Gen2 中创建过数据流,并且想要更改其存储位置,该怎么办?

创建数据流后,你无法更改数据流的存储位置。

我何时可以更改环境的数据流存储位置?

目前,不支持更改环境的数据流存储位置。

后续步骤

本文提供有关如何连接 Azure Data Lake Storage Gen2 帐户以进行数据流存储的指导。

有关数据流、Common Data Model 和 Azure Data Lake Storage Gen2 的详细信息,请转到以下文章:

有关 Azure 存储的详细信息,请转到此文章:

有关 Common Data Model 的详细信息,请转到以下文章:

你可以在 Power Apps 社区中提问。