访问 Databricks 市场中的数据产品(已启用 Unity Catalog 的工作区)
本文介绍如何在 Databricks 市场中访问数据产品(如果你有一个启用了 Unity Catalog 的 Azure Databricks 工作区)。
注意
如果你没有启用了 Unity Catalog 的 Azure Databricks 工作区,可以使用 Delta Sharing 开放共享连接器访问共享的市场数据产品。 请参阅使用外部平台在 Databricks 市场中访问数据产品。
概述
Databricks Marketplace 为数据使用者提供了一个安全平台,用于发现实现组织成功所需的数据产品。 Databricks Marketplace 使用增量共享来提供对共享数据的安全性和控制。 使用者可以访问公共数据、免费示例数据和商业化数据产品/服务。 使用启用了 Unity 目录的 Azure Databricks 工作区的使用者不仅可以访问表格数据,还可以访问卷(非表格数据)、AI 模型、Databricks 笔记本和 Databricks 解决方案加速器。
如果你使用的市场数据产品使用启用了 Unity Catalog 的 Azure Databricks 工作区,你可以利用 Delta Sharing 与 Unity Catalog 之间的深度集成,以及 Unity Catalog 治理、审核和便捷界面。
开始之前的准备工作
若要在 Databricks Marketplace 上浏览数据产品列表,可以使用以下方法之一:
- 开放市场。
- 一个 Azure Databricks 工作区。
若要使用数据产品(其中使用了已启用 Unity Catalog 的 Databricks 工作区),必须满足以下要求:
高级计划上的 Azure Databricks 帐户
一个启用了 Unity Catalog 的 Azure Databricks 工作区(必需)。 请参阅为工作区启用 Unity Catalog。
如果没有帐户,可以获取免费试用版。 在“开放市场”上单击“免费试用”,并按照提示开始试用。
重要
无需为 Unity Catalog 启用所有工作区。 可以使用该工作区来接收市场数据产品,为 Unity Catalog 创建新目录并启用它。 如果此选项不可用,请使用外部平台上的市场选项。 请参阅使用外部平台在 Databricks 市场中访问数据产品。
若要了解如何为 Unity Catalog 启用工作区,请参阅设置和管理 Unity Catalog。
附加到工作区的 Unity Catalog 元存储的
USE MARKETPLACE ASSETS
权限。 请参阅仅适用于 Delta Sharing 或 Databricks Marketplace 的特权类型。 默认情况下,为所有 Unity Catalog 元存储上的所有用户启用此权限。如果管理员已禁用此权限,你可以请求他们向你授予该权限,或者请求他们向你授予以下任一权限:
- Unity Catalog 元存储上的
CREATE CATALOG
和USE PROVIDER
权限。 - 元存储管理员角色。
如果你没有任何这些权限,仍可以查看市场列表,但无法使用 Unity Catalog 访问数据产品。
有关详细信息,请参阅 Unity Catalog 权限和安全对象和管理 Unity Catalog 中的权限。 另请参阅 禁用市场访问。
- Unity Catalog 元存储上的
浏览 Databricks 市场列表
若要查找所需的数据产品,只需在 Databricks Marketplace 中浏览或搜索数据产品列表。
注意
作为以下说明的替代方法,可以使用 Azure Databricks 工作区顶部的全局搜索栏搜索市场列表。 请参阅搜索工作区项目。 还可以在“添加数据”页上查看和请求免费示例数据。 在工作区边栏中,单击“数据引入”,向下滚动到 Databricks 市场的“免费示例数据”。
转到 marketplace.databricks.com 或登入 Azure Databricks 工作区并单击 “市场”。
浏览或搜索所需的数据产品。
可以按产品类型(数据集、解决方案加速器或 ML 模型)、提供商名称、类别、费用(免费或付费)或关键字搜索来筛选列表。
如果你已登录到 Azure Databricks 工作区,则还可以选择仅查看作为专用交换的一部分可用的专用列表。 请参阅 参与专用交换。
请求访问市场中的数据产品
若要请求访问数据产品,必须登录到 Azure Databricks 工作区。 某些数据产品可立即可用,其他数据产品则需要使用提供程序接口进行提供程序批准和事务完成。
要求
请参阅准备工作。 若要访问市场中的数据产品,必须至少具有附加到正在使用的工作区的 Unity Catalog 元存储的 USE MARKETPLACE ASSETS
权限。
访问即时可用的数据产品
某些数据产品即时可用,只需你请求它们并同意条款。 它们列在市场登陆页上的“免费和即时可用”标题下,在列表磁贴上标识为“免费”,在列表详细信息页上标识为“即时可用 ”。
在市场登陆页上找到感兴趣的商品后,单击该列表以打开列表详细信息页。
单击“获取即时访问”按钮并接受 Databricks 条款和条件。
访问 Databricks 解决方案加速器的工作方式略有不同。 请参阅访问 Databricks 解决方案加速器。
(可选)在“更多选项”下,修改建议的目录名称。
目录名称显示在 Azure Databricks 工作区的目录资源管理器中,并在查询中由三部分组成的命名空间 (catalog.schema.table|volume|view) 中使用。 可以更改默认名称。
单击“获取即时访问权限”按钮。
单击“打开”按钮查看数据产品,该数据产品在目录资源管理器中显示为只读目录。
有关管理对 Azure Databricks 中目录的访问的信息,请参阅使用 Unity Catalog 访问共享数据。
如果示例笔记本可用,它们将显示在列表中的示例笔记本标题下。
若要查看笔记本,请单击“预览笔记本”按钮。 若要将笔记本导入 Azure Databricks 工作区以便运行它,请单击“预览笔记本”,然后单击“导入笔记本”。 请参阅 Databricks 笔记本简介。
请求需要提供商批准的数据产品
某些数据产品需要提供商批准,通常是因为涉及商业事务,或者提供商可能更愿意为你自定义数据产品。 这些列表在列表详细信息页上标识为“按请求提供”,并包含“请求访问”按钮。
在市场登陆页上找到感兴趣的商品后,单击该列表以打开列表详细信息页。
单击“请求访问”按钮。
输入你的姓名、公司和对数据产品预期用途的简要说明。
接受 Databricks 条款和条件,然后单击“请求访问”。
提供商完成对请求的审查后,将通过电子邮件通知你。
还可以在市场的“我的请求”页上监视请求的进度。 请参阅管理共享的 Databricks 市场数据产品。 但是,后续的任何交易都将使用提供商通信和支付平台。 不会在 Databricks Marketplace 上直接处理任何商业事务。
事务完成后,数据提供程序会将数据产品作为工作区中的只读目录提供给你。
有关管理对 Azure Databricks 中目录的访问的信息,请参阅使用 Unity Catalog 访问共享数据。
访问 Databricks 解决方案加速器
可以通过克隆 Git 存储库并使其在 Databricks Git 文件夹中可用来共享 Databricks 解决方案加速器,这不同于其他数据资产。 若要访问解决方案加速器,请执行以下操作:
- 在市场中单击解决方案加速器列表,以打开列表详细信息页面。
- 单击“获取即时访问权限”按钮。
- 在“添加 Git 文件夹”对话框中,输入存储库的名称。 此名称将显示在 Databricks Git 文件夹 UI 中。
- 接受 Databricks 条款和条件,然后单击“创建 Git 文件夹”。
- 单击“打开”按钮,然后选择“Git 文件夹”以查看工作区文件浏览器中的存储库。
使用 Unity Catalog 访问共享数据
对 Azure Databricks 工作区中数据的访问取决于数据产品类型:
市场数据集和模型在 Azure Databricks 的只读目录中与你共享。 目录是 Unity Catalog 管理的数据资产的顶级容器。 有关 Unity Catalog 中的数据对象层次结构的详细信息,请参阅 Azure Databricks 中的数据库对象。
提供商与你共享数据后,即可通过多种方式访问目录。 以下部分描述了其中一些访问选项。
笔记本直接在市场列表中共享,你可以将它们从列表导入到工作区中。
解决方案加速器作为 Databricks Git 文件夹共享。 请参阅访问 Databricks 解决方案加速器。
在市场中访问共享数据集
若要从市场访问共享数据:
在边栏中,单击 “市场”。
在“市场登陆”页上,单击右上角的“我的请求”。
在“已安装的数据产品”选项卡上,找到数据产品,点击数据产品行末尾的 kebab 菜单,并选择“查看数据”。
还可以单击数据产品名称打开数据产品详细信息页,可在其中单击“打开”按钮查看数据。
目录资源管理器会打开包含该数据集的目录,可在其中访问数据或管理其他团队成员的访问权限。 请参阅 向其他团队成员授予访问权限。
若要详细了解如何在 Azure Databricks 中访问共享数据,请参阅使用 Databricks-to-Databricks Delta Sharing 读取共享的数据(针对接收者)。
在目录资源管理器中访问共享数据集
直接从目录资源管理器访问共享数据:
- 在边栏中,单击 “目录”。
- 如果知道保存共享数据的目录的名称,请搜索并选择它。
如果不知道目录名称,但知道提供程序名称,可通过执行以下操作在目录资源管理器中找到该目录:
- 在边栏中,单击 “目录”。
- 在目录资源管理器的左侧窗格中,单击“增量共享”,然后单击“与我共享”。
- 在“提供商”选项卡上,单击提供商名称。
- 在“共享”选项卡上,找到目录名称并单击它以将其打开。
使用 Databricks CLI 或 SQL 语句访问共享数据集
还可以使用 Azure Databricks 笔记本或 Databricks SQL 编辑器查询中的 Databricks CLI 或 SQL 语句查找和访问包含共享数据的目录。 有关详细信息,请参阅访问共享表或卷中的数据。 可以跳过介绍如何创建目录的部分,因为 Databricks Marketplace 会为你执行此操作。
向其他团队成员授予访问权限
如果你是请求共享数据的用户,则你是工作区中包含该数据的目录的所有者。 因此,你可以向团队成员授予对目录的访问权限,并在架构、表、视图、行和列级别优化访问权限,就像在 Unity Catalog 中执行任何数据一样。 请参阅在 Unity Catalog 中管理权限。 也就是说,共享目录下的表和视图数据是只读的,这意味着只能授予团队读取操作,如 DESCRIBE
、SHOW
和 SELECT
。
还可以转让对目录或其内部对象的所有权。
查看示例笔记本
某些列表包括列表详细信息页上的示例笔记本。 要访问这些笔记本以获取已共享的即时可用列表,请执行以下操作:
- 在边栏中,单击 “市场”。
- 在“市场登陆”页上,单击右上角的“我的请求”。
- 在“已安装的数据产品”选项卡上,找到数据产品,然后单击数据产品名称以打开列表详细信息页面。 如有示例笔记本,它将显示在列表中的示例笔记本标题下。
- 单击“预览笔记本”查看笔记本,然后单击“导入笔记本”将其导 Azure Databricks 工作区。
注意
示例笔记本在列表 UI 中的显示和预览在 Chrome Incognito 模式下不起作用。
参与专用交换
某些数据提供商可能希望与受邀加入专用交换 的一组有限使用者共享某些数据。 可以通过选中市场主页上的“专用交换”复选框来查找私人交流列表。 就像使用公共列表一样,你可以立即访问免费列表,也可以请求访问标记为“按请求提供”的那些列表。
若要加入专用交换,数据提供商需要邀请你的组织。 当他们这样做时,他们将请求 Unity Catalog 元存储的共享标识符。 若要了解如何获取元存储的共享标识符,请参阅 在 Databricks 到 Databricks 模型中获取访问权限 中的步骤 1。
若要了解有关专用交换的详细信息,请参阅 在 Databricks Marketplace 中创建和管理专用交换。
禁用市场访问
默认情况下,任何已启用 Unity Catalog 的工作区中的所有用户都可以在 Databricks Marketplace 中请求数据产品。 换句话说,account users
组对所有 Unity Catalog 元存储拥有 USE MARKETPLACE ASSETS
特权,除非元存储管理员撤销该特权。
此特权不授予参与与数据提供商的金融交易的能力。 所有金融交易都在 Azure Databricks 之外进行。 此权限确实授予访问标记为“免费且即时可用”的数据产品以及已购买的数据产品的能力。 访问此类数据产品会在 Azure Databricks 中创建由请求者拥有的新只读目录,请求者可以向其他用户授予只读访问权限。
元存储管理员可以禁用所有用户在 Databricks 市场中请求数据产品的能力,方法是从 Unity Catalog 元存储上的 account users
组撤消 USE MARKETPLACE ASSETS
权限。 如果撤销此权限,用户可以继续在其工作区中浏览 Databricks 市场,但无法请求数据产品。
所需的权限:元存储管理员
注意
如果工作区已自动为 Unity Catalog 启用,你可能没有元存储管理员。有关详细信息,请参阅自动启用 Unity Catalog。
目录资源管理器
若要撤消 account users
组的 USE MARKETPLACE ASSETS
权限,请执行以下操作:
- 在 Azure Databricks 工作区中,单击 “目录”。
- 单击左上角的元存储名称旁边的链接图标。
- 找到授予
account users
权限USE MARKETPLACE ASSETS
的行。 - 单击行旁边的复选框,然后单击“撤销”按钮。
- 确认撤销操作。
- 单击“授予”按钮,向喜欢的任何特定用户和组授予权限。
SQL
若要撤消 account users
组的权限 USE MARKETPLACE ASSETS
,请在笔记本或 Databricks SQL 查询编辑器中运行以下命令。
REVOKE USE MARKETPLACE ASSETS ON METASTORE FROM `account users`;
若要授予特定用户或组的权限 USE MARKETPLACE ASSETS
,请在笔记本或 Databricks SQL 查询编辑器中运行以下命令。
GRANT USE MARKETPLACE ASSETS ON METASTORE TO `<user-or-group>`;
如果根本不希望用户能够查看市场主页,请联系 Azure Databricks 帐户团队。
已知问题
如果访问请求被数据提供商拒绝,则无法再次请求相同的数据产品。 如果遇到此问题,请联系提供商或 Azure Databricks 帐户团队。
分享你的反馈
我们很乐意倾听你对 Databricks 市场的看法。
- 有反馈? 在市场主页上转到 Learn > 提供反馈。
- 想要在市场中查看其他数据集? 单击“市场”主页横幅上的“建议产品”。