Freigeben über


tuple_union_agg_double Aggregatfunktion

Gilt für:check marked yes Databricks Runtime 18.1 und höher

Union multiple TupleSketch binary representations with double summaryes into a single merged sketch. Verwenden Sie diese Funktion, um vorab aggregierte Skizzen aus verschiedenen Partitionen oder Datenquellen zu kombinieren.

Syntax

tuple_union_agg_double ( sketch [, lgNomEntries [, mode ]] )

Argumente

  • Skizze: Ein TupleSketch im Binärformat mit doppelten Zusammenfassungen (z. B. aus tuple_sketch_agg_double).
  • lgNomEntries: Ein optionales INTEGER Literal, das die Log-Base-2 der Nominaleinträge für die Union angibt. Muss zwischen 4 und 26 einschließlich liegen. Der Standardwert ist 12.
  • modus: Ein optionales STRING Literal, das den Aggregationsmodus für die Kombination doppelter Schlüsselzusammenfassungen angibt. Gültige Werte: 'sum', 'min', 'max', 'alwaysone'. Der Standardwert lautet 'sum'.

Rückkehr

Ein BINARY Wert mit dem zusammengeführten TupleSketch mit doppelten Zusammenfassungen.

Hinweise

  • NULL Eingabeskizzen werden während der Aggregation ignoriert.
  • Der Vereinigungsvorgang kombiniert Skizzen, auch wenn sie unterschiedliche lgNomEntries-Werte aufweisen.
  • Verwenden Sie zum Zusammenführen genau zwei Skizzen die skalare tuple_union_double-Funktion .

Fehlermeldungen

Beispiele

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_double(tuple_union_agg_double(sketch)) FROM (
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (1, 5.0D), (2, 10.0D) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (2, 3.0D), (3, 7.0D) tab(key, summary)
  );
3.0