適用対象:はい Databricks Runtime 18.1 以降と![]()
複数の TupleSketch バイナリ表現と、2 重のサマリーを結合した 1 つのスケッチに結合します。 この関数を使用して、さまざまなパーティションまたはデータ ソースから事前に集計されたスケッチを結合します。
構文
tuple_union_agg_double ( sketch [, lgNomEntries [, mode ]] )
論争
- スケッチ: バイナリ形式の TupleSketch ( tuple_sketch_agg_doubleなど) を 2 重のサマリーで指定します。
-
lgNomEntries: 共用体の名目エントリの log-base-2 を指定する省略可能な
INTEGERリテラル。 4 ~ 26 の範囲で指定する必要があります。 既定値は 12 です。 -
mode: 重複するキーの概要を結合するための集計モードを指定する省略可能な
STRINGリテラル。 有効な値:'sum'、'min'、'max'、'alwaysone'。 既定値は、'sum'です。
返品ポリシー
マージされた TupleSketch と二重の概要を含む BINARY 値。
注記
-
NULL入力スケッチは集計中は無視されます。 - 和集合演算では、lgNomEntries 値が異なる場合でもスケッチが結合されます。
- 正確に 2 つのスケッチをマージするには、スカラー tuple_union_double 関数を使用します。
エラー メッセージ
例示
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_double(tuple_union_agg_double(sketch)) FROM (
SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (1, 5.0D), (2, 10.0D) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (2, 3.0D), (3, 7.0D) tab(key, summary)
);
3.0