Sdílet prostřednictvím


tuple_intersection_agg_integer agregační funkce

Platí pro:check označený ano Databricks Runtime 18.1 a novější

Vypočítá průnik více binárních reprezentací TupleSketch pomocí celočíselného souhrnu. Vrátí skicu obsahující pouze klíče společné pro všechny vstupní skicy.

Syntaxe

tuple_intersection_agg_integer ( sketch [, mode ] )

Arguments

  • skica: TupleSketch v binárním formátu s celočíselnou souhrny (například z tuple_sketch_agg_integer).
  • mode: Volitelný STRING literál určující režim agregace pro kombinování souhrnů duplicitních klíčů. Platné hodnoty: 'sum', 'min', 'max''alwaysone'. Výchozí hodnota je 'sum'.

Návraty

Hodnota BINARY obsahující protínané tupleSketch s celými čísly.

Poznámky

  • NULL Během agregace se ignorují vstupní skicy.
  • Výsledek obsahuje pouze klíče, které se zobrazí ve všech vstupních skicách.
  • Pro protínání přesně dvou skic použijte skalární tuple_intersection_integer funkci.

Chybové zprávy

Příklady

-- Find keys common to all sketches
> SELECT tuple_sketch_estimate_integer(tuple_intersection_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 1), (2, 2), (3, 3) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 2), (3, 3), (4, 4) tab(key, summary)
  );
2.0