你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

教程:使用 Azure Data Share 接受和接收数据

本教程介绍如何使用 Azure Data Share 接受数据共享邀请。 另外还介绍如何接收共享给你的数据,以及如何启用定期刷新时间间隔,确保共享给你的数据快照始终是最新的。

  • 如何接受 Azure Data Share 邀请
  • 创建 Azure Data Share 帐户
  • 指定数据目标
  • 创建按计划刷新的数据共享的订阅

先决条件

在接受数据共享邀请之前,必须创建一些 Azure 资源,这些资源已在下面列出。

确保在接受数据共享邀请之前已满足所有先决条件。

  • Azure 订阅:如果没有 Azure 订阅,请在开始之前创建一个免费帐户
  • Data Share 邀请:Microsoft Azure 发出的邀请,主题名为“来自 yourdataprovider@domain.com 的 Azure Data Share 邀请”。
  • 在你将在其中创建 Data Share 资源的 Azure 订阅以及目标 Azure 数据存储所在的 Azure 订阅中注册 Microsoft.DataShare 资源提供程序

将数据接收到存储帐户

  • 一个 Azure 存储帐户:如果没有,可以创建一个 Azure 存储帐户
  • 向存储帐户进行写入的权限,此权限位于 Microsoft.Storage/storageAccounts/write 中。 “存储帐户参与者”角色有此权限。
  • 向存储帐户添加角色分配的权限,此权限存在于 Microsoft.Authorization/role assignments/write 中。 “所有者”角色有此权限。

将数据接收到基于 SQL 的目标中

如果选择将数据接收到 Azure SQL 数据库和 Azure Synapse Analytics,请查看以下相关先决条件的列表。

将数据接收到 Azure SQL 数据库或 Azure Synapse Analytics(以前称为 Azure SQL DW)的先决条件

  • Azure SQL 数据库或 Azure Synapse Analytics(以前称为 Azure SQL DW)。
  • 向 SQL 服务器上的数据库进行写入的权限,此权限存在于 Microsoft.Sql/servers/databases/write 中。 “参与者”角色有此权限。
  • SQL Server 的 Microsoft Entra 管理员
  • SQL Server 防火墙访问权限。 可以通过以下步骤完成此操作:
    1. 在 Azure 门户中的 SQL Server 中,导航到“防火墙和虚拟网络”
    2. 对于“允许 Azure 服务和资源访问此服务器”,选择“是”。
    3. 单击“+ 添加客户端 IP”。 客户端 IP 地址可能会更改。 下次从 Azure 门户共享 SQL 数据时,可能需要重复此过程。 还可以添加 IP 范围。
    4. 选择“保存”。

将数据接收到 Azure Synapse Analytics(工作区)SQL 池的先决条件

  • Azure Synapse Analytics(工作区)专用 SQL 池。 目前不支持将数据接收到无服务器 SQL 池中。

  • 在 Synapse 工作区中写入 SQL 池的权限,该权限位于 Microsoft.Synapse/workspaces/sqlPools/write。 “参与者”角色有此权限。

  • Data Share 资源的托管标识用于访问 Synapse 工作区 SQL 池的权限。 可以通过以下步骤完成此操作:

    1. 在 Azure 门户中导航到 Synapse 工作区。 从左侧导航栏中选择“SQL Active Directory 管理员”,将你自己设置为“Microsoft Entra 管理员”

    2. 打开 Synapse Studio,从左侧导航栏中选择“管理”。 在“安全性”下选择“访问控制”。 为自己分配“SQL 管理员”或“工作区管理员”角色 。

    3. 在 Synapse Studio 中,从左侧导航栏中选择“开发”。 在 SQL 池中执行以下脚本,以将 Data Share 资源托管标识添加为“db_datareader, db_datawriter, db_ddladmin”。

      create user "<share_acc_name>" from external provider; 
      exec sp_addrolemember db_datareader, "<share_acc_name>"; 
      exec sp_addrolemember db_datawriter, "<share_acc_name>"; 
      exec sp_addrolemember db_ddladmin, "<share_acc_name>";
      

      请注意,<share_acc_name> 是 Data Share 资源的名称。 如果尚未创建 Data Share 资源,则可以稍后返回到该先决条件。

  • Synapse 工作区防火墙访问权限。 可以通过以下步骤完成此操作:

    1. 在 Azure 门户中导航到 Synapse 工作区。 从左侧导航栏中选择“防火墙”。
    2. 对于“允许 Azure 服务和资源访问此工作区”,选择“启用”。
    3. 单击“+ 添加客户端 IP”。 客户端 IP 地址可能会更改。 下次从 Azure 门户共享 SQL 数据时,可能需要重复此过程。 还可以添加 IP 范围。
    4. 选择“保存”。

将数据接收到 Azure 数据资源管理器群集中:

  • 数据提供程序的数据资源管理器群集所在的同一 Azure 数据中心内的 Azure 数据资源管理器群集:如果没有此群集,可以创建一个 Azure 数据资源管理器群集。 如果你不知道数据提供程序群集的 Azure 数据中心,可以稍后在此过程中创建群集。
  • 向 Azure 数据资源管理器群集进行写入的权限,此权限存在于 Microsoft.Kusto/clusters/write 中。 “参与者”角色有此权限。

登录到 Azure 门户

登录 Azure 门户

打开邀请

  1. 可以从电子邮件或直接从 Azure 门户打开邀请。

    若要从电子邮件打开邀请,请检查收件箱中是否有来自数据提供程序的邀请。 邀请来自 Microsoft Azure,标题为“来自 yourdataprovider@domain.com 的 Azure Data Share 邀请”。 选择“查看邀请”,在 Azure 中查看邀请。

    若要直接从 Azure 门户打开邀请,请在 Azure 门户中搜索“数据共享邀请” 。 此操作会转到“Data Share 邀请”列表。

    如果你是租户的来宾用户,则在首次查看 Data Share 邀请之前,系统会要求你验证租户的电子邮件地址。 验证后,它将在 12 个月内有效。

    List of Invitations

  2. 选择要查看的邀请。

接受邀请

  1. 确保查看所有字段,包括“使用条款”。 如果同意使用条款,则必须勾选表示同意的框。

    Terms of use

  2. 在“目标 Data Share 帐户”下选择要在其中部署 Data Share 的订阅和资源组。

    对于“Data Share 帐户”字段,如果没有现有的 Data Share 帐户,请选择“新建”。 否则,请选择一个现有的 Data Share 帐户来接受数据共享。

    对于“已接收共享的名称”字段,可以保留数据提供者指定的默认值,也可以为已接收共享指定新名称

    同意使用条款并指定用于管理已接收共享的数据共享帐户以后,请选择“接受并配置”。 将创建共享订阅。

    Accept options

    此操作会将你转到 Data Share 帐户中接收的共享。

    如果不想接受邀请,请选择“拒绝”。

配置已接收共享

按照以下步骤配置要接收数据的位置。

  1. 选择“数据集”选项卡。选中要为其分配目标位置的数据集旁边的复选框。 选择“+ 映射到目标”以选择目标数据存储。

    Map to target

  2. 选择以哪种目标数据存储类型保存数据。 目标数据存储中具有相同路径和名称的任何数据文件或表将被覆盖。 如果要将数据接收到 Azure SQL 数据库或 Azure Synapse Analytics(以前称为 Azure SQL DW)中,请选中复选框“允许‘数据共享’以我的名义运行上述‘创建用户’脚本”。

    对于就地共享,请选择指定“位置”中的数据存储。 “位置”是数据提供程序的源数据存储所在的 Azure 数据中心。 映射数据集之后,可以通过目标路径中的链接来访问数据。

    Target storage account

  3. 对于基于快照的共享,如果数据提供程序已创建定期更新数据的快照计划,你还可以通过选择“快照计划”选项卡来启用快照计划。选中快照计划旁边的框,然后选择“+ 启用”。 第一个计划快照将在计划时间的一分钟内启动,后续快照将在计划时间的几秒内启动。

    Enable snapshot schedule

    每次运行后,复制文件的元数据不会保留。 这是设计的结果。

触发快照

这些步骤仅适用于基于快照的共享。

  1. 可以通过依次选择“详细信息”选项卡、“触发快照”来触发快照 。 在这里,可以触发数据的完整或增量快照。 如果是首次从数据提供者处接收数据,请选择完整副本。

    Trigger snapshot

  2. 如果上次运行状态为“成功”,请转到目标数据存储来查看接收的数据。 选择“数据集”,然后选择“目标路径”中的链接。

    Consumer datasets

查看历史记录

此步骤仅适用于基于快照的共享。 若要查看快照历史记录,请选择“历史记录”选项卡。在这里可以找到包含过去 30 天生成的所有快照的历史记录。

清理资源

当不再需要该资源时,请转到“数据共享概述”页面并选择“删除”以将其删除。

后续步骤

本教程介绍了如何接受和接收 Azure Data Share。 若要详细了解 Azure Data Share 概念,请继续了解 Azure Data Share 术语。