你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

快速入门:使用 Microsoft Purview 数据共享(预览版)就地共享和接收 Azure 存储数据

重要

此功能目前以预览版提供。 Azure 预览版补充条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的其他法律条款。

本文提供有关如何从 Azure Data Lake Storage (ADLS Gen2) 或 Blob 存储帐户共享数据和接收共享的快速指南。

有关数据共享工作原理的概述,请观看这段简短演示

先决条件

Microsoft Purview 先决条件

  • 一个 Microsoft Purview 帐户。 也可以使用两个 Microsoft Purview 帐户,一个帐户供数据提供者使用,另一个帐户供数据使用者用来测试两个工作流。
  • 接收方的 Azure 登录电子邮件地址,用于向接收方发送邀请。 不能使用接收方的电子邮件别名。

Azure 存储帐户先决条件

  • 必须为 AllowDataSharing 预览功能注册 Azure 订阅。 使用 Azure 门户或 PowerShell 执行以下步骤。

    1. 在 Azure 门户中,选择要用于创建源和目标存储帐户的 Azure 订阅。
    2. 从左侧菜单中,选择“设置”下的“预览功能”。
    3. 选择“AllowDataSharing”和“注册”。
    4. 刷新“预览功能”屏幕以验证“状态”是否为“已注册”。 完成注册可能需要 15 分钟到 1 小时。

    有关详细信息,请参阅注册预览功能

  • 在完成注册步骤后创建的源和目标存储帐户。 这两个存储帐户必须位于同一 Azure 区域。 这两个存储帐户都需要是 ADLS Gen2 或 Blob 存储帐户。 存储帐户可以与 Microsoft Purview 帐户位于不同的 Azure 区域。

    注意

    下面是支持的存储帐户配置:

    • Azure 区域:加拿大中部、加拿大东部、英国南部、英国西部、澳大利亚东部、日本东部、韩国南部和南非北部
    • 性能:“标准”
    • 冗余选项:LRS、GRS、RA-GRS
  • 最新版本的存储 SDK、PowerShell、CLI 和 Azure 存储资源管理器。 存储 REST API 版本必须为 2020 年 2 月版或更高版本。

  • 存储帐户需要在发送或接收共享的集合中注册。 如果使用一个 Microsoft Purview 帐户,则可以在两个不同的集合中注册,也可以在同一个集合中注册。 有关注册的说明,请参阅 ADLS Gen2Blob 存储数据源页。

  • 如果源或目标存储帐户所在的 Azure 订阅与 Microsoft Purview 帐户不同,则 Microsoft.Purview 资源提供程序会自动在共享提供程序添加资产或共享使用者映射资产时数据存储所在的 Azure 订阅中注册(且仅当用户有权为资源提供程序执行 /register/action 操作时)。 此权限包含在“参与者”和“所有者”角色中。

    注意

    仅当第一次将数据共享或接收到 Azure 订阅中的存储帐户时,才需要此注册。

必需的角色

下面是共享数据和接收共享所需的角色。

Azure 存储帐户角色 Microsoft Purview 集合角色
数据提供程序 所有者或存储 Blob 数据所有者 数据共享参与者
数据使用者 参与者、所有者、存储 Blob 数据参与者或存储 Blob 数据所有者 数据共享参与者

注意

如果你创建了 Microsoft Purview 帐户,则已自动为你分配根集合的所有角色。 请参阅 Microsoft Purview 权限,了解有关 Microsoft Purview 集合和角色的详细信息。

创建共享

  1. Microsoft Purview 治理门户中,从左侧导航栏中选择“数据共享”图标,然后选择“创建新共享”。

    显示 Microsoft Purview 治理门户中数据共享概述页的屏幕截图。

  2. 提供共享的详细信息。 指定名称、共享类型、共享内容说明(可选)和集合。 然后选择“继续”。

    如果下拉列表中未显示集合,则表示你没有可访问任何 Microsoft Purview 集合的“数据共享参与者”角色,因此无法共享数据。 请联系集合管理员为你授予访问权限。

    显示“创建共享”和“输入详细信息”窗口的屏幕截图,其中突出显示了“继续”按钮。

  3. 若要选择要共享的数据,请选择“添加资产”。

    突出显示了“新建共享”窗口中“添加资产”按钮的屏幕截图。

  4. 选择资产类型,以及一个已注册到 Microsoft Purview 的存储帐户。 选择“继续”。

    如果下拉列表中未显示存储帐户,请选择下面的“注册要从其共享的新源”链接以注册存储帐户。 需要先将 Azure 资源注册到 Microsoft Purview,然后才能从该源共享数据。 存储帐户需要注册到与共享相同的集合中。 有关注册的说明,请参阅 ADLS Gen2Blob 存储数据源页。

    显示“选择源”的屏幕截图,其中选择了 ADLS Gen2 帐户并突出显示了“继续”。

  5. 浏览存储帐户层次结构并选择(选中)要共享的对象。 然后选择“添加” 。

    注意

    从存储帐户共享时,目前仅支持文件和文件夹。 目前不支持从容器共享。

    显示“添加资产”页的屏幕截图,其中选择了多个要共享的文件夹并突出显示了“添加”按钮。

  6. 检查所选的资产。 (可选)编辑接收方将看到的“名称”和“显示名称”。 选择“继续”。

    显示“添加资产”第二页的屏幕截图,其中列出了资产路径,并显示了可编辑的显示名称栏。

  7. 选择“添加接收方”。 输入要与其共享数据的用户的 Azure 登录电子邮件地址。 选择“创建并共享”。 (可选)可以指定过期日期,到了该日期将终止共享。 可以通过多次单击“添加接收方”来与多个接收方共享相同的数据。

    注意

    在 Microsoft Purview 治理门户中,只能使用用户的 Azure 登录电子邮件地址作为接收方。 在 Microsoft Purview SDK 或 API 中,可以使用用户或服务主体的对象 ID 作为接收方,并可以选择性地指定目标租户 ID(即,Azure 租户接收方可以接收共享)。

    显示“添加接收方”页的屏幕截图,其中突出显示了“添加接收方”按钮,并添加了两个用户。

现已创建共享。 共享的接收方将收到邀请,他们可以在其 Microsoft Purview 帐户中查看待处理的共享。

接收共享

  1. 可以在任何 Microsoft Purview 帐户中查看待处理的共享。 在 Azure 门户中,搜索并选择要用于接收共享的 Microsoft Purview 帐户。

  2. 打开 Microsoft Purview 治理门户。 从左侧导航中选择“数据共享”图标。 然后选择“待处理的已接收共享”。 如果收到电子邮件邀请,还可以选择电子邮件中的“查看待处理的共享”链接以选择 Microsoft Purview 帐户。

    如果你是租户的来宾用户,系统将要求你在首次查看待处理的已接收共享之前验证租户的电子邮件地址。 验证后,它将在 12 个月内有效。

    显示 Microsoft Purview 治理门户中“待处理的已接收共享”按钮的屏幕截图。

  3. 选择要查看的待处理共享的名称。

    显示“已接收共享”窗口中“待处理”选项卡的屏幕截图,其中突出显示了选择待处理共享的操作。

  4. 指定“已接收共享名称”和集合。 选择“接受并配置”。 如果不想接受邀请,请选择“拒绝”。

    显示待处理共享配置页的屏幕截图,其中添加了共享名称、选择了集合并突出显示了“接受并配置”按钮。

  5. 继续映射资产。 选择资产旁边的“映射”以指定要接收或访问共享数据的目标数据存储。

    显示映射资产窗口的屏幕截图,其中在资产旁边突出显示了映射按钮以指定要接收或访问共享数据的目标数据存储。

  6. 对于就地共享,目标类型和位置由数据提供程序的源类型和位置确定。 选择与源相同的类型和位置的存储帐户。

    如果下拉列表中未显示存储帐户,请选择下面的“注册新数据存储以映射资产”链接以注册存储帐户。 需要先向 Microsoft Purview 注册 Azure 资源,然后才能将数据传入该资源。 存储帐户需要注册到与收到的共享相同的集合中。

    输入映射资产所需的其他信息。 选择“映射到目标”。

    注意

    共享数据映射到的容器是只读的。 不能写入容器。 可以将多个共享映射到同一容器。

    显示映射资产窗口的屏幕截图,其中包含存储帐户、路径和文件夹,并在页面底部突出显示了映射到目标按钮。

  7. 屏幕将显示正在进行中的“映射”。 资产映射可能需要几分钟时间。 选择“关闭” 。

    配置资产映射后,可以选择“关闭”。 不需等待映射完成。

    显示映射资产窗口的屏幕截图,其中正在进行映射,并在窗口顶部突出显示了关闭按钮。

  8. 选择“资产”选项卡以监视映射状态。 映射完成后,你将在屏幕中收到通知。 状态将从“正在映射”改为“已映射”。

    显示 Microsoft Purview 治理门户中收到的共享的屏幕截图,其中选择了“共享”,打开了“资产”菜单,状态显示为“已映射”。

  9. 可以通过 Azure 门户、Azure 存储资源管理器、Azure 存储 SDK、PowerShell 或 CLI 从目标存储帐户访问共享数据。 还可以通过将存储帐户连接到 Azure Synapse Analytics Spark 或 Databricks 来分析共享数据。

清理资源

若要清理为本快速入门创建的资源,请执行以下步骤:

  1. Microsoft Purview 治理门户删除发送的共享
  2. 另外删除接收的共享
  3. 成功删除共享后,删除接收共享数据时在目标存储帐户中创建的目标容器和 Microsoft Purview 文件夹。

疑难解答

若要排查数据共享问题,请参阅有关如何共享数据的文章的故障排除部分。 若要排查共享接收问题,请参阅有关如何接收共享数据的文章的故障排除部分

后续步骤