适用于:
Databricks Runtime 18.1 及更高版本
将多个元组二进制表示形式与整数摘要合并成单个合并的草图。 使用此函数可以组合来自不同分区或数据源的预聚合草图。
Syntax
tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )
Arguments
- 草图:采用二进制格式的元组和整数摘要(如来自 tuple_sketch_agg_integer)。
-
lgNomEntries:一个可选
INTEGER文本,用于指定联合的名义条目的 log-base-2。 必须介于 4 到 26 之间(含)。 默认值为 12。 -
mode:一个可选
STRING文本,用于指定聚合模式以组合重复键摘要。 有效值:'sum'、'min'、'max'、'alwaysone'。 默认值为'sum'。
退货
一个 BINARY 值,包含包含包含整数摘要的合并元组。
注释
-
NULL聚合期间忽略输入草图。 - 联合作将草图组合在一起,即使它们具有不同的 lgNomEntries 值。
- 若要完全合并两个草图,请使用标量 tuple_union_integer 函数。
错误消息
例子
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
);
3.0