快速入门:使用Microsoft Purview 数据共享 (预览) 就地共享和接收 Azure 存储数据

重要

此功能目前处于预览阶段。 Microsoft Azure 预览版补充使用条款包括适用于 Beta 版、预览版或其他尚未正式发布的 Azure 功能的其他法律条款。

本文提供了有关如何共享数据和从 Azure Data Lake Storage (ADLS Gen2) 或 Blob 存储帐户接收共享的快速指南。

先决条件

Microsoft Purview 先决条件

  • Microsoft Purview 帐户。 还可以使用两个 Microsoft Purview 帐户,一个用于数据提供程序,另一个用于数据使用者,以测试这两种方案。
  • 可用于向其发送邀请的收件人的 Azure 登录电子邮件地址。 收件人的电子邮件别名不起作用。

Azure 存储帐户先决条件

  • Azure 订阅必须注册 AllowDataSharing 预览版功能。 使用 Azure 门户 或 PowerShell 执行以下步骤。

    1. 在“Azure 门户”中,选择用于创建源和目标存储帐户的 Azure 订阅。
    2. 在左侧菜单中,选择“设置”下的“预览功能”。
    3. 选择 “AllowDataSharing”“注册”。
    4. 刷新 “预览功能 ”屏幕,验证 状态 是否为 “已注册”。 完成注册可能需要 15 分钟到 1 小时。
    5. 此外,若要将数据共享用于美国东部、美国东部 2、北欧、美国中南部、美国中西部、西欧、美国西部、美国西部 2、美国西部 3 的存储帐户,请选择 AllowDataSharingInHeroRegion 和 Register

    有关详细信息,请参阅 注册预览功能

    RegistrationState 应为 Registered。 完成注册可能需要 15 分钟到 1 小时。 有关详细信息,请参阅 注册预览功能

    注意

    以下是支持的存储帐户配置:

    • Azure 区域:加拿大中部、加拿大东部、英国南部、英国西部、澳大利亚东部、日本东部、韩国南部和南非北部
    • 其他 Azure 区域:美国东部、美国东部 2、北欧、美国中南部、美国中西部、西欧、美国西部、美国西部 2、美国西部 3
    • 性能:标准
    • 冗余选项:LRS
  • 完成注册步骤 后创建的 源和目标存储帐户。 两个存储帐户必须彼此位于同一 Azure 区域中。 这两个存储帐户都需要是 ADLS Gen2 或 Blob 存储帐户。 存储帐户可以位于与 Microsoft Purview 帐户不同的 Azure 区域。

  • 最新版本的存储 SDK、PowerShell、CLI 和 Azure 存储资源管理器。 存储 REST API 版本必须为 2020 年 2 月或更高版本。

  • 存储帐户需要在要发送或接收共享的集合中注册。 如果使用一个 Microsoft Purview 帐户,这可以是两个不同的集合,也可以是同一个集合。 有关注册的说明,请参阅 ADLS Gen2Blob 存储 数据源页。

  • 如果源或目标存储帐户与 Microsoft Purview 帐户的订阅位于不同的 Azure 订阅中,则当共享提供程序添加资产或共享使用者映射资产时,Microsoft.Purview 资源提供程序会自动在数据存储所在的 Azure 订阅中注册, 并且仅 当用户有权为资源提供程序执行 /register/action 操作时。 该权限包含在“参与者”和“所有者”角色中。

    注意

    仅当首次将数据共享或接收到 Azure 订阅中的存储帐户时,才需要此注册。

所需角色

下面是共享数据和接收共享所需的角色。

Azure 存储帐户角色 Microsoft Purview 集合角色
数据提供程序 以下角色之一:
  • 所有者
  • 存储 Blob 数据所有者
数据读取器
数据使用者 以下角色之一:
  • 参与者
  • 所有者
  • 存储 Blob 数据参与者
  • 存储 Blob 数据所有者
数据读取器

注意

如果创建了 Microsoft Purview 帐户,系统会自动将所有角色分配给根集合。 若要详细了解 Microsoft Purview 集合和角色,请参阅 Microsoft Purview 权限。

创建共享

可通过两种方式创建数据共享:

从资产创建共享

  1. 可以从 数据目录

    经典 Microsoft Purview 治理门户或新的 Microsoft Purview 门户中,使用数据目录搜索浏览查找要共享数据的 Azure 存储或Azure Data Lake Storage (ADLS) Gen 2 数据资产。

    显示 Microsoft Purview 治理门户主页的屏幕截图,其中突出显示了搜索和浏览选项。

  2. 找到数据资产后,选择“Data Share”按钮。

    Microsoft Purview 治理门户中数据资产的屏幕截图,其中突出显示了“Data Share”按钮。

  3. 选择“ +新建共享”。

    “Data Share管理”窗口的屏幕截图,其中突出显示了“新建共享”按钮。

  4. 按照 其余步骤创建数据共享。

从应用程序创建共享

  1. 如果使用新的 Microsoft Purview 体验,可以从 数据目录开始创建共享。

    打开 Microsoft Purview 门户。 导航到 数据目录 应用程序。 然后从左侧导航栏中选择“ 共享 ”。 选择“ +新建共享”。

  2. 如果使用 分类 Microsoft Purview 体验 ,可以从 数据映射开始创建共享。

    打开 Microsoft Purview 治理门户。 从左侧导航栏中选择 “数据映射 ”图标。 然后选择“ 共享”。 选择“ +新建共享”。

    显示 Microsoft Purview 治理门户数据映射的屏幕截图,其中突出显示了“数据映射”、“共享”和“新建共享”。

  3. 从任一位置,选择存储帐户类型和要从中共享数据的存储帐户。 然后,选择“继续”

    显示“新建共享创建”步骤的屏幕截图,其中突出显示了“类型”和“存储帐户”选项。

  4. 按照 其余步骤创建数据共享。

创建共享

  1. 指定共享内容的名称和说明, (可选) 。 然后,选择“继续”

    显示“创建共享并输入详细信息”窗口的屏幕截图,其中突出显示了“继续”按钮。

  2. 在容器、文件夹或文件级别搜索并添加要共享的所有资产,然后选择“ 继续”。

    显示“添加资产”窗口的屏幕截图,其中选择了要共享的文件和文件夹。

  3. 如果需要,可以编辑共享数据将具有的显示名称。 然后,选择“继续”

    显示第二个“添加资产”窗口的屏幕截图,显示名称保持不变。

  4. 选择 “添加收件人 ”,然后选择“ 用户 ”或“ 应用”。

    若要与用户共享数据,请选择“ 用户”,然后输入要与之共享数据的 Azure 登录电子邮件地址。 默认情况下,将显示用于输入用户电子邮件地址的选项。

    显示“添加收件人”页面的屏幕截图,其中突出显示了“添加收件人”按钮,并显示了默认用户电子邮件选项。

    若要与服务主体共享数据,请选择“ 应用”。 输入要与其共享数据的收件人的对象 ID 和租户 ID。

    显示“添加应用收件人”页面的屏幕截图,其中突出显示了“添加应用”选项和必填字段。

  5. 选择“ 创建和共享”。 (可选)可以指定终止共享的 到期日期 。 通过多次选择“ 添加 收件人”,可以与多个收件人共享相同的数据。

现已创建共享。 共享的收件人将收到邀请,他们可以在其 Microsoft Purview 帐户中查看挂起的共享。

接收共享

  1. 可以在任何 Microsoft Purview 帐户中查看共享邀请。 通过直接浏览到 经典门户新的 Microsoft Purview 门户并选择 Microsoft Purview 帐户,打开 Microsoft Purview 治理门户。

  2. 在经典门户中,从左侧导航栏中选择 “数据映射 ”图标。 在新门户中,导航到 数据目录 应用程序。

  3. 选择 “共享邀请”。 如果收到电子邮件邀请,还可以选择电子邮件中的“ 查看共享邀请 ”链接以选择 Microsoft Purview 帐户。

    如果你是租户的来宾用户,系统会要求你在首次查看共享邀请之前验证租户的电子邮件地址。 有关步骤,请参阅我们的指南。 验证后,有效期为 12 个月。

    显示 Microsoft Purview 治理门户中的“共享邀请”页的屏幕截图。

  4. 或者,在 Microsoft Purview 门户中,使用数据目录搜索浏览找到要接收共享的 Azure 存储或Azure Data Lake Storage (ADLS) Gen 2 数据资产。 选择“Data Share”按钮。 可以在“共享邀请”选项卡中查看所有 邀请

  5. 选择要查看或配置的共享的名称。

  6. 如果不想接受邀请,请选择“ 删除”。

    显示共享附件页的屏幕截图,其中突出显示了“删除”按钮。

    注意

    如果删除邀请,如果希望将来接受共享,则需要重新接收该共享。 若要取消选择共享而不删除,请改为选择“ 取消 ”按钮。

  7. 如果需要,可以编辑 “已接收共享名称 ”。 然后,为源所在的同一区域中的目标存储帐户选择存储帐户 名称 。 还可以选择 注册新的存储帐户,以在下拉列表中附加共享

    重要

    目标存储帐户必须与源存储帐户位于同一 Azure 区域。

  8. 配置 “路径 ” (新的容器名称或现有共享容器的名称) ,“ 新建文件夹 ” (容器) 中共享的新文件夹名称。

  9. 选择“ 附加到目标”。

    显示共享邀请配置页的屏幕截图,其中添加了共享名称,选择了集合,并突出显示了“接受和配置”按钮。

  10. 在“管理数据共享”页上,你将看到状态为“ 正在附加 ”的新共享,直到它已完成并已附加。

    显示“附加共享”窗口的屏幕截图,其中在指定要接收或访问共享数据的目标数据存储后突出显示了“附加”按钮。

  11. 可以通过Azure 门户、Azure 存储资源管理器、Azure 存储 SDK、PowerShell 或 CLI 从目标存储帐户访问共享数据。 还可以通过将存储帐户连接到 Azure Synapse Analytics Spark 或 Databricks 来分析共享数据。

清理资源

若要清理为快速入门创建的资源,请执行以下步骤:

  1. 在 Microsoft Purview 门户中, 删除已发送的共享
  2. 同时 删除收到的共享
  3. 成功删除共享后,请在收到共享数据时删除目标容器和 Microsoft Purview 在目标存储帐户中创建的文件夹。

排除故障

若要排查共享数据的问题,请参阅 如何共享数据一文的故障排除部分。 若要排查接收共享的问题,请参阅 如何接收共享数据一文的故障排除部分

后续步骤