培训
搜索工作区对象
本文介绍如何在 Azure Databricks 工作区中搜索表、卷、笔记本、查询、仪表板、警报、文件、文件夹、库、作业、存储库、合作伙伴和市场列表。
表必须在 Unity Catalog 中注册才能显示在搜索结果中。
在使用客户管理的密钥进行加密的工作区中,笔记本内容和查询内容在搜索中不可用。
Azure Databricks 搜索利用 DatabricksIQ(适用于 Azure Databricks 的数据智能引擎)提供更智能的 AI 驱动的搜索体验。 AI 生成的注释使用 LLM 自动向 Unity Catalog 管理的表和列添加说明和标记。 这些注释使搜索引擎能够了解独特的公司行话、指标和语义,并为其提供所需的上下文来使搜索结果更切题、准确且可操作。
若要使用 UI 顶部栏中的导航式搜索来搜索工作区,请执行以下操作:
单击 Azure Databricks 工作区顶部栏中的“搜索”字段,或使用键盘快捷键 Command-P。
最近使用过的文件、笔记本、查询、警报和仪表板会列在“最近使用的内容”下,按上次打开日期排序。
输入搜索条件。
根据搜索条件筛选列表中最近使用过的对象。 导航式搜索可能还会推荐与你的条件匹配的其他对象。 若要执行工作区的完整搜索,请使用“搜索结果”页。
从列表中选择一个项。
整页搜索体验提供了更多空间来查看结果、更多对象的元数据,还提供了更多筛选器来用于缩小结果范围。
若要在“搜索结果”页上按对象类型、对象所有者或上次修改日期筛选搜索结果,请执行以下操作:
单击 Azure Databricks 工作区顶部栏中的“搜索”字段,或使用键盘快捷键 Command-P,然后按 Enter。
“搜索结果”页随即打开。
输入搜索条件。
从列表中选择一个项。
可以按文本字符串和/或对象类型进行搜索。 当你键入搜索条件并按 Enter 后,系统会在你有权访问的工作区中搜索所有查询、仪表板、警报、文件、文件夹、笔记本、库、存储库、合作伙伴和市场列表的名称。 如果你的工作区启用了 Unity Catalog,则系统还会搜索表名、表注释、列名和列注释。
若要搜索文本字符串,请在搜索字段中键入字符串并按 Enter。 系统会在你有权访问的工作区中搜索所有对象的名称。 它还搜索笔记本命令中的文本,但不搜索非笔记本文件中的文本。
可以在搜索条目的两侧添加引号,以将搜索结果缩小为仅包含确切短语的文档。
完全匹配搜索支持以下内容:
- 基本引号(例如
"spark.sql("
) - 转义引号(例如
"spark.sql(\"select"
)
完全匹配搜索不支持以下项:
- 带有引号和不带引号(例如
"spark.sql" partition
) - 多个引号(例如
"spark.sql" "partition"
)
重要
此功能目前以公共预览版提供。
你可以使用自然语言来搜索 Unity Catalog 表。 搜索将返回具有相关语义的结果。
例如,搜索查询“我应将什么用于地理”侧重于“地理”,并查找包含城市、国家/地区、领土和地理位置等地理属性的相关术语。
该搜索还可以通过将可能是搜索词的内容与筛选器分离来理解搜索查询中的模式,这意味着自然语言查询功能更为强大。
例如,搜索查询“显示有关检查的表”将被分解,将“检查”作为关键字,将“表”作为用户要搜索的对象类型。
在“搜索结果”页上,可以通过从“类型”下拉列表或页面右侧的选项卡中单击对象类型来按类型(例如文件、文件夹、笔记本、库、表或存储库)搜索项目。 文本字符串不是必需的。 如果你将文本字段留空,然后按 Enter,系统会搜索该类型的所有对象。 单击列表中的某个名称可在工作区中打开该项目。 你还可以使用下拉菜单进一步缩小特定类型项目的搜索结果,例如按所有者或上次修改日期。
你还可以在 UI 顶部的搜索栏中在搜索查询中指定筛选器。 例如,你可以在搜索查询中包括以下内容来搜索你拥有的表:type:table owner:me
。 若要详细了解如何通过语法指定筛选器,请在“搜索结果”页上应用筛选器,并查看搜索栏中的查询如何自动更新。
搜索使用热度信号(基于工作区中其他用户与特定表进行交互的频率)来改进表的排名方式。
如果不使用热度提升,你将不得不查询搜索结果中返回的表,才能知道哪一个是权威表。 使用热度提升,最热门的表排名更高,所以你不必猜测哪个是合适的表。 搜索结果中表名旁边的热度指示符 反映了对象排名。 你还可以按热度对搜索结果进行排序。
当搜索能够高度自信地识别出你正在寻找的东西时,排名最高的搜索结果就会变成一张知识卡片。 知识卡片提供额外的对象元数据。 Unity Catalog 托管表支持知识卡片。
在启用了 Unity Catalog 的工作区中,可以搜索 Unity Catalog 中注册的表和模型。 可以搜索以下任意一项:
- 表、视图或模型名称。
- 表、视图或模型注释。
- 表或视图列名称。
- 表或视图列注释。
- 表或视图标记键。
若要按父目录、父架构、所有者或标记在“搜索结果”页上筛选搜索结果,请单击“类型”下拉菜单并选择“表”。 筛选器下拉菜单显示在页面顶部。
还可以按表的受欢迎程度对结果进行排序。
搜索结果不包括:
你无权查看的表、视图和模型。
换言之,要使某个表或模型显示在搜索结果中,你必须至少对该表拥有
SELECT
特权或对该模型拥有EXECUTE
特权,对其父架构拥有USE SCHEMA
特权,并对其父目录拥有USE CATALOG
特权。 默认情况下,元存储管理员拥有这些特权。 必须向所有其他用户授予这些特权。 请参阅 Unity Catalog 特权和安全对象。旧版 Hive 元存储中(即
hive_metastore
目录中)的表和视图。要将这些表升级到 Unity Catalog 并使其可供搜索,请按照将 Hive 表和视图升级到 Unity Catalog 中的说明操作。
工作区模型注册表中的模型。
若要升级 ML 工作流以在 Unity Catalog 中创建模型,请参阅升级 ML 工作流以针对 Unity Catalog 中的模型。
可以使用 Azure Databricks 工作区搜索栏通过标记键和标记值搜索表、卷、视图和表列。 还可以使用标记键通过工作区搜索筛选表和视图。 无法搜索其他标记对象,例如目录或架构。 另请参阅将标记应用于 Unity Catalog 安全对象。
搜索结果中仅显示你有权查看的表和视图。
使用标记搜索表、视图和列:
单击 Azure Databricks 工作区顶部栏中的“搜索”字段,或使用键盘快捷键 Command-P。
不能使用 Catalog Explorer 中的筛选器字段按标记进行搜索。
输入搜索条件。 输入表或列标记键或值,搜索标记的表或列。 必须使用确切的标记键或值项。
如果要单独按标记键进行搜索,请使用语法:
tag:<tag_key>
。 若要按标记键和标记值进行搜索,请省略tag:
。
使用标记键筛选表搜索结果:
- 单击 Azure Databricks 工作区顶部栏中的“搜索”字段,或使用键盘快捷键 Command-P。
- 输入搜索词或将搜索字段留空。
- 在“搜索结果”页上,单击“类型”下拉菜单,然后选择“表”。
- 使用“标记”筛选器下拉菜单选择标记键。