Sdílet prostřednictvím


tuple_union_agg_double agregační funkce

Platí pro:check označený ano Databricks Runtime 18.1 a novější

Sjednocuje několik binárních reprezentací tupleSketch s dvojitými souhrny do jediné sloučené skicy. Pomocí této funkce můžete kombinovat předem agregované náčrty z různých oddílů nebo zdrojů dat.

Syntaxe

tuple_union_agg_double ( sketch [, lgNomEntries [, mode ]] )

Arguments

  • skica: TupleSketch v binárním formátu s dvojitými souhrny (například z tuple_sketch_agg_double).
  • lgNomEntries: Volitelný INTEGER literál určující log-base-2 nominálních položek pro sjednocení. Musí být mezi 4 a 26 včetně. Výchozí hodnota je 12.
  • mode: Volitelný STRING literál určující režim agregace pro kombinování souhrnů duplicitních klíčů. Platné hodnoty: 'sum', 'min', 'max''alwaysone'. Výchozí hodnota je 'sum'.

Návraty

Hodnota BINARY obsahující sloučenou kolekci TupleSketch s dvojitými souhrny.

Poznámky

  • NULL Během agregace se ignorují vstupní skicy.
  • Operace sjednocení kombinuje skici i v případě, že mají různé hodnoty lgNomEntries.
  • Ke sloučení přesně dvou skic použijte skalární tuple_union_double funkci.

Chybové zprávy

Příklady

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_double(tuple_union_agg_double(sketch)) FROM (
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (1, 5.0D), (2, 10.0D) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (2, 3.0D), (3, 7.0D) tab(key, summary)
  );
3.0