查询筛选器

查询筛选器允许以交互方式减少可视化效果中显示的数据量。 查询筛选器类似于查询参数,但存在一些主要差异。 查询筛选器限制执行查询 的数据。 这使得筛选器非常适合较小的数据集和环境,其中查询执行非常耗时、速率有限或成本高昂。

下面介绍了 Databricks SQL 的一些优势。

  • 尽管以前的查询筛选器仅运行客户端,但这些更新的筛选器在客户端或服务器端动态工作,以优化性能。
  • 简化的 UI 体验:单击“ +添加筛选器 ”按钮,然后从下拉列表中选择列以添加筛选器。 无需创作、许可和刷新独立查询即可筛选列的不同值。
  • 启用“突出显示相关值”以查看筛选器中的哪些选择将返回给定其他筛选选择的结果。 例如,考虑同时具有“State”和“City”筛选器的用户。 如果用户选择突出显示相关值,则选择州筛选器中的“加利福尼亚州”将仅突出显示“城市”筛选器中的加利福尼亚州城市。 非突出显示的选项位于下拉列表中的“筛选出”菜单选项下。
  • 文本输入筛选器:根据文本输入搜索筛选列结果。 搜索可以通过三种模式找到匹配项:“精确匹配”、“包含”和“开头为”。
  • 使用快速日期选择器可以筛选预定义的日期范围,例如上周、上个月、去年等。
  • 创建日期筛选器时,可以设置默认日期范围。
  • 还可以在仪表板上使用查询筛选器。 默认情况下,过滤器部件显示在查询中添加了过滤器的每个可视化旁边。 若要将筛选器小组件链接到仪表板级查询筛选器,请参阅 仪表板筛选器

功能说明

运行查询后,在 “结果 ”面板中,单击 + 并选择“ 筛选器”。

+添加筛选器 ”按钮将打开一个弹出菜单,可在其中应用以下筛选器和设置。

  • 列:要对其应用筛选器的列。
    • 目前支持字符串、数字和日期。
    • 如果所选列包含日期,用户可以选择按日期、月份或年份指定时间分档。
  • 类型:要应用的筛选器类型
    • 单选:仅筛选出一个字段值
    • 多选:筛选出多个字段值
    • 文本输入:输入字符串以搜索特定列中的匹配值。 支持“包含”、“完全匹配”和“以...开头”匹配方式
    • 日期/时间选取器和范围选取器:能够选择日期或日期范围来根据日期数据类型筛选
  • 排序顺序:对筛选器下拉列表的值进行排序的顺序。 可以在“升序”或“降序”之间进行选择。
  • 突出显示相关值(y/n):启用此选项以轻松查看筛选器中的哪些选择将返回给定其他筛选选择的结果。 例如,考虑同时具有“State”和“City”筛选器的用户。 如果用户选择突出显示相关值,则在州筛选器中选择“加利福尼亚州”将突出显示“城市”筛选器中可用的选项集,以仅显示加利福尼亚州的城市,而未突出显示的选项将放在下拉列表中的“筛选出”菜单选项下。 请注意,每次更新筛选器时,都需要运行查询。
  • 默认值:当选择“date”类型列并选择时间分段值(如天、月或年)时,用户还可以为筛选器选择设置默认日期范围。 每当刷新查询时,都会自动应用默认筛选器。

局限性

  • 请务必注意,查询筛选器应用于整个数据集。 但是,查询筛选器的下拉列表选择器限制为 64k 个唯一值。 如果用户希望在超过 64k 个唯一筛选值的情况下进行筛选,建议改用 Text 参数。
  • 筛选器只能应用于查询返回的列,而不是引用表的所有列。
  • 筛选器在返回的结果中显示指定列中不同的选项列表。 如果结果有限(即查询运行限制 为 1000),则筛选器将仅显示来自这 1000 个结果中的唯一值。
  • 虽然应用于查询的筛选器将优化以在客户端或服务器端运行以提高性能,但应用于仪表板的筛选器将始终在服务器端运行。