次の方法で共有


tuple_union_agg_double 集計関数

適用対象:はい Databricks Runtime 18.1 以降とマークされているチェック

複数の TupleSketch バイナリ表現と、2 重のサマリーを結合した 1 つのスケッチに結合します。 この関数を使用して、さまざまなパーティションまたはデータ ソースから事前に集計されたスケッチを結合します。

構文

tuple_union_agg_double ( sketch [, lgNomEntries [, mode ]] )

論争

  • スケッチ: バイナリ形式の TupleSketch ( tuple_sketch_agg_doubleなど) を 2 重のサマリーで指定します。
  • lgNomEntries: 共用体の名目エントリの log-base-2 を指定する省略可能な INTEGER リテラル。 4 ~ 26 の範囲で指定する必要があります。 既定値は 12 です。
  • mode: 重複するキーの概要を結合するための集計モードを指定する省略可能な STRING リテラル。 有効な値: 'sum''min''max''alwaysone'。 既定値は、'sum' です。

返品ポリシー

マージされた TupleSketch と二重の概要を含む BINARY 値。

注記

  • NULL 入力スケッチは集計中は無視されます。
  • 和集合演算では、lgNomEntries 値が異なる場合でもスケッチが結合されます。
  • 正確に 2 つのスケッチをマージするには、スカラー tuple_union_double 関数を使用します。

エラー メッセージ

例示

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_double(tuple_union_agg_double(sketch)) FROM (
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (1, 5.0D), (2, 10.0D) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (2, 3.0D), (3, 7.0D) tab(key, summary)
  );
3.0