使用 Delta Sharing 开放共享协议共享数据(针对提供者)
本文概述了提供者如何使用 Delta Sharing 开放共享协议与任何位置的任何计算平台上的任何用户共享已启用 Unity Catalog 的 Azure Databricks 工作区中的数据。
注意
如果你是数据接收者(正在与其共享数据的用户或用户组),请参阅使用 Delta Sharing 访问与你共享的数据(适用于接收者)。
谁应该使用 Delta Sharing 开放共享协议?
有 3 种方法来使用 Delta Sharing 共享数据:
Databricks 开放共享协议(参见本文),它让你能够与任何计算平台上的用户共享你在启用了 Unity Catalog 的 Databricks 工作区中管理的数据。
此方法使用 Azure Databricks 中内置的 Delta Sharing 服务器,并且在你使用 Unity Catalog 管理数据并希望与不使用 Databricks 或无权访问启用了 Unity Catalog 的 Databricks 工作区的用户共享数据时,此方法非常有用。 与提供者端的 Unity Catalog 的集成简化了提供者的设置和管理。
开源 Delta Sharing 服务器的客户管理的实现,它让你能够在任何平台之间进行共享(无论是否是 Databricks)。
Databricks 到 Databricks 共享协议,它让你能够将你启用了 Unity Catalog 的工作区中的数据与也有权访问已启用 Unity Catalog 的 Databricks 工作区的用户进行共享。
有关 Delta Sharing 的简介以及这三种方法的相关详细信息,请参阅什么是 Delta Sharing?。
Delta Sharing 开放共享工作流
本部分提供开放共享工作流的大致概述,并提供每个步骤的详细文档链接。
在 Delta Sharing 开放共享模型中:
数据提供程序会创建一个收件人,该收件人是一个命名对象,表示数据提供程序要与之共享数据的用户或用户组。
数据提供程序创建收件人时,Azure Databricks 会生成令牌、包含令牌的凭据文件,以及一个激活链接,数据提供程序可以将该链接发送给收件人以访问该凭据文件。
有关详细信息,请参阅 步骤 1:创建收件人。
数据提供程序创建一个共享,该共享是一个命名对象,包含在提供程序帐户的 Unity Catalog 元存储中注册的表的集合。
有关详细信息,请参阅创建和管理 Delta Sharing 的共享。
数据提供程序为接收者授予对共享的访问权限。
有关详细信息,请参阅管理对 Delta Sharing 数据共享的访问权限(适用于提供者)。
数据提供程序通过安全通道向收件人发送激活链接,以及有关使用激活链接下载凭据文件的说明,收件人将使用该文件与数据提供程序建立安全连接以接收共享数据。
有关详细信息,请参阅步骤 2:获取激活链接。
数据收件人按照激活链接下载凭据文件,然后使用凭据文件访问共享数据。
共享数据是只读的。 用户可以使用其选择的平台或工具访问数据。
有关详细信息,请参阅读取使用 Delta Sharing 开放共享共享的数据(针对接收者)。
开放共享的设置和安全注意事项
使用开放共享模型时,良好的令牌管理是安全共享数据的关键:
- 打算使用开放共享的数据提供程序在为其 Unity Catalog 元存储启用 Delta Sharing 时,必须配置默认收件人令牌生存期。 Databricks 建议为令牌配置有效期限。 请参阅对元存储启用 Delta Sharing。
- 如果需要修改默认令牌生存期,请参阅修改收件人令牌生存期。
- 鼓励收件人安全地管理其下载的凭据文件。
- 有关令牌管理和开放共享安全性的详细信息,请参阅管理收件人令牌(开放共享)。
数据提供程序可以通过指定 IP 访问列表来限制收件人访问特定的网络位置,从而提供额外的安全性。 请参阅使用 IP 访问列表限制 Delta Sharing 接收者访问权限(开放共享)。