Condividi tramite


tuple_union_agg_integer funzione di aggregazione

Si applica a:check contrassegnato come sì Databricks Runtime 18.1 e versioni successive

Unisce più rappresentazioni binarie TupleSketch con riepiloghi interi in un singolo schizzo unito. Utilizzare questa funzione per combinare schizzi preaggregati da partizioni o origini dati diverse.

Sintassi

tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )

Arguments

  • sketch: TupleSketch in formato binario con riepiloghi interi (ad esempio da tuple_sketch_agg_integer).
  • lgNomEntries: valore letterale facoltativo INTEGER che specifica il log-base-2 delle voci nominale per l'unione. Deve essere compreso tra 4 e 26 inclusi. Il valore predefinito è 12.
  • mode: valore letterale facoltativo STRING che specifica la modalità di aggregazione per la combinazione di riepiloghi di chiavi duplicati. Valori validi: 'sum', 'min', 'max', 'alwaysone'. Il valore predefinito è 'sum'.

Restituzioni

Valore BINARY contenente il TupleSketch unito con riepiloghi integer.

Note

  • NULL gli schizzi di input vengono ignorati durante l'aggregazione.
  • L'operazione di unione combina schizzi anche quando hanno valori lgNomEntries diversi.
  • Per unire esattamente due schizzi, usare la funzione tuple_union_integer scalare.

Messaggi di errore

Esempi

-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
    UNION ALL
    SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
  );
3.0