Condividi tramite


tuple_sketch_agg_integer funzione di aggregazione

Si applica a:check contrassegnato come sì Databricks Runtime 18.1 e versioni successive

Crea un oggetto Datasketches TupleSketch da coppie chiave-valore in cui le chiavi vengono usate per il conteggio distinto e i valori di riepilogo integer vengono aggregati in base alla modalità specificata.

Sintassi

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: espressione per il conteggio di valori univoci. I tipi accettati sono INTEGER, LONG, FLOATDOUBLE, STRING, BINARY, , ARRAY<INTEGER>e ARRAY<LONG>.
  • summary: INTEGER valore a cui associare e aggregare per ogni chiave.
  • lgNomEntries: valore letterale facoltativo INTEGER che specifica il log-base-2 delle voci nominale. Deve essere compreso tra 4 e 26 inclusi. Il valore predefinito è 12 (4.096 bucket). I valori più elevati offrono una maggiore precisione, ma usano più memoria.
  • mode: valore letterale facoltativo STRING che specifica la modalità di aggregazione per i riepiloghi. Valori validi: 'sum', 'min', 'max', 'alwaysone'. Il valore predefinito è 'sum'.

Restituzioni

Valore BINARY contenente il TupleSketch compatto serializzato con riepiloghi integer.

Note

  • NULL i valori chiave o di riepilogo vengono ignorati durante l'aggregazione.
  • Le stringhe vuote, le matrici di byte vuote e le matrici vuote vengono ignorate per le chiavi.
  • I lgNomEntries parametri e mode devono essere valori costanti.
  • Usare tuple_sketch_estimate_integer per ottenere la stima del conteggio distinto.
  • Usare tuple_sketch_summary_integer per ottenere il valore di riepilogo aggregato.

Messaggi di errore

Esempi

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6