通过


tuple_union_agg_integer 聚合函数

适用于:检查标记为“是”的 Databricks Runtime 18.1 及更高版本

将多个元组二进制表示形式与整数摘要合并成单个合并的草图。 使用此函数可以组合来自不同分区或数据源的预聚合草图。

Syntax

tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )

Arguments

  • 草图:采用二进制格式的元组和整数摘要(如来自 tuple_sketch_agg_integer)。
  • lgNomEntries:一个可选 INTEGER 文本,用于指定联合的名义条目的 log-base-2。 必须介于 4 到 26 之间(含)。 默认值为 12。
  • mode:一个可选 STRING 文本,用于指定聚合模式以组合重复键摘要。 有效值: 'sum''min''max''alwaysone'。 默认值为 'sum'

退货

一个 BINARY 值,包含包含包含整数摘要的合并元组。

注释

  • NULL 聚合期间忽略输入草图。
  • 联合作将草图组合在一起,即使它们具有不同的 lgNomEntries 值。
  • 若要完全合并两个草图,请使用标量 tuple_union_integer 函数。

错误消息

例子

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
  );
3.0