什么是 Databricks 市场?
本文介绍 Databricks 市场,这是一个用于交换数据产品的开放论坛。 Databricks 市场利用 Delta Sharing 为数据提供者提供可安全共享数据产品的工具,并让数据使用者能够发现和扩展对所需数据和数据服务的访问权限。
Databricks 市场中共享哪些类型的数据资产?
市场资产包括数据集、Databricks 笔记本、Databricks 解决方案加速器和机器学习 (AI) 模型。 数据集通常以表格数据目录的形式提供,但也支持 Azure Databricks 卷形式的非表格数据。 解决方案加速器作为可克隆的 Git 存储库提供。
使用者如何访问 Databricks 市场中的数据?
若要在 Databricks 市场上查找所需的数据产品,只需浏览或搜索提供商列表即可。
你可以浏览:
- 开放市场,此功能不需要 Databricks 工作区的访问权限。
- Databricks 工作区上的 Databricks 市场。 只需单击 “市场”。
若要请求市场中的数据产品,必须在 Databricks 工作区中使用市场。 虽然使用启用了 Unity Catalog 的 Databricks 工作区可使你利用 Unity Catalog 与 Delta Sharing 的深度集成,但无需 Databricks 工作区即可访问和处理共享的数据。
某些数据产品可供公共市场中的所有人使用,而其他数据产品则作为专用交换的一部分提供,其中提供商仅与成员使用者共享其列表。 无论是公共还是专用,只要你提出请求并同意条款,某些数据产品就可以立即使用。 其他数据产品可能需要提供商审批并使用提供商接口完成事务。 在任何情况下,为市场提供支持的 Delta Sharing 协议都可确保你可以安全地访问共享数据。
开始访问数据产品
了解如何作为数据使用者开始操作:
- 使用启用了 Unity Catalog 的 Databricks 工作区,请参阅访问 Databricks 市场中的数据产品(启用了 Unity Catalog 的工作区)。
- 使用 Power BI、pandas 或 Apache Spark 等第三方平台以及未启用 Unity Catalog 的 Databricks 工作区,请参阅使用外部平台在 Databricks 市场中访问数据产品。
提供商如何在 Databricks 市场中列出数据产品?
Databricks 市场为数据提供商提供了一个共享数据产品的安全平台,数据科学家和分析师可以利用这些数据产品来帮助其组织取得成功。 Databricks 市场使用 Delta Sharing 来提供对共享数据的安全保护和控制。 你可以共享公共数据、免费示例数据和商业化数据产品/服务。 你可以在公共列表中共享数据产品,也可以作为所创建的专用交换的一部分共享数据产品,如果是后者,列表仅对成员使用者可见。 除了数据集之外,还可以共享 Databricks 笔记本和其他内容,以演示用例并向客户展示如何充分利用你的数据产品。
开始列出数据产品
若要在 Databricks 市场上列出数据产品,必须满足以下条件:
- 拥有 Databricks 帐户和已启用 Unity Catalog 的高级工作区。 无需为所有工作区启用 Unity Catalog。 可以专门创建一个,用于管理市场列表。
- 通过 Databricks 数据合作伙伴计划申请成为提供商。 或如果只想通过专用交换共享数据,可以在提供程序控制台中使用自助服务注册流。 请参阅申请成为 Databricks 市场提供商。
- 查看市场提供商策略。
若要了解如何开始操作,请参阅在 Databricks 市场中列出数据产品。
查看演示
此视频对 Databricks 市场进行了介绍,展示了使用者如何访问列表以及提供商如何创建列表。