Freigeben über


tuple_intersection_agg_integer Aggregatfunktion

Gilt für:check marked yes Databricks Runtime 18.1 und höher

Berechnet die Schnittmenge mehrerer TupleSketch-Binärdarstellungen mit ganzzahligen Zusammenfassungen. Gibt eine Skizze zurück, die nur Schlüssel enthält, die allen Eingabeskizzen gemeinsam sind.

Syntax

tuple_intersection_agg_integer ( sketch [, mode ] )

Argumente

  • Skizze: Ein TupleSketch im Binärformat mit ganzzahligen Zusammenfassungen (z. B. aus tuple_sketch_agg_integer).
  • modus: Ein optionales STRING Literal, das den Aggregationsmodus für die Kombination doppelter Schlüsselzusammenfassungen angibt. Gültige Werte: 'sum', 'min', 'max', 'alwaysone'. Der Standardwert lautet 'sum'.

Rückkehr

Ein BINARY Wert, der den überschneidenden TupleSketch mit ganzzahligen Zusammenfassungen enthält.

Hinweise

  • NULL Eingabeskizzen werden während der Aggregation ignoriert.
  • Das Ergebnis enthält nur Schlüssel, die in allen Eingabeskizzen angezeigt werden.
  • Verwenden Sie die skalare tuple_intersection_integer-Funktion , um genau zwei Skizzen zu überschneiden.

Fehlermeldungen

Beispiele

-- Find keys common to all sketches
> SELECT tuple_sketch_estimate_integer(tuple_intersection_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 1), (2, 2), (3, 3) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 2), (3, 3), (4, 4) tab(key, summary)
  );
2.0