次の方法で共有


tuple_union_agg_integer 集計関数

適用対象:はい Databricks Runtime 18.1 以降とマークされているチェック

複数の TupleSketch バイナリ表現と整数のサマリーを結合した 1 つのスケッチに結合します。 この関数を使用して、さまざまなパーティションまたはデータ ソースから事前に集計されたスケッチを結合します。

構文

tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )

論争

  • スケッチ: 整数の概要 ( tuple_sketch_agg_integerなど) を含むバイナリ形式の TupleSketch。
  • lgNomEntries: 共用体の名目エントリの log-base-2 を指定する省略可能な INTEGER リテラル。 4 ~ 26 の範囲で指定する必要があります。 既定値は 12 です。
  • mode: 重複するキーの概要を結合するための集計モードを指定する省略可能な STRING リテラル。 有効な値: 'sum''min''max''alwaysone'。 既定値は、'sum' です。

返品ポリシー

マージされた TupleSketch と整数の概要を含む BINARY 値。

注記

  • NULL 入力スケッチは集計中は無視されます。
  • 和集合演算では、lgNomEntries 値が異なる場合でもスケッチが結合されます。
  • 正確に 2 つのスケッチをマージするには、スカラー tuple_union_integer 関数を使用します。

エラー メッセージ

例示

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
  );
3.0