Condividi tramite


tuple_sketch_agg_double funzione di aggregazione

Si applica a:check contrassegnato come sì Databricks Runtime 18.1 e versioni successive

Crea un Oggetto Datasketches TupleSketch da coppie chiave-valore in cui le chiavi vengono usate per il conteggio distinto e i valori di riepilogo double vengono aggregati in base alla modalità specificata.

Sintassi

tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: espressione per il conteggio di valori univoci. I tipi accettati sono INTEGER, LONG, FLOATDOUBLE, STRING, BINARY, , ARRAY<INTEGER>e ARRAY<LONG>.
  • summary: DOUBLE valore a cui associare e aggregare per ogni chiave.
  • lgNomEntries: valore letterale facoltativo INTEGER che specifica il log-base-2 delle voci nominale. Deve essere compreso tra 4 e 26 inclusi. Il valore predefinito è 12 (4.096 bucket). I valori più elevati offrono una maggiore precisione, ma usano più memoria.
  • mode: valore letterale facoltativo STRING che specifica la modalità di aggregazione per i riepiloghi. Valori validi: 'sum', 'min', 'max', 'alwaysone'. Il valore predefinito è 'sum'.

Restituzioni

Valore BINARY contenente il TupleSketch compatto serializzato con riepiloghi doppi.

Note

  • NULL i valori chiave o di riepilogo vengono ignorati durante l'aggregazione.
  • Le stringhe vuote, le matrici di byte vuote e le matrici vuote vengono ignorate per le chiavi.
  • I lgNomEntries parametri e mode devono essere valori costanti.
  • Usare tuple_sketch_estimate_double per ottenere la stima del conteggio distinto.
  • Usare tuple_sketch_summary_double per ottenere il valore di riepilogo aggregato.

Messaggi di errore

Esempi

-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0

-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0