Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Si applica a:
Databricks Runtime 18.1 e versioni successive
Crea un Oggetto Datasketches TupleSketch da coppie chiave-valore in cui le chiavi vengono usate per il conteggio distinto e i valori di riepilogo double vengono aggregati in base alla modalità specificata.
Sintassi
tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
key: espressione per il conteggio di valori univoci. I tipi accettati sono
INTEGER,LONG,FLOATDOUBLE,STRING,BINARY, ,ARRAY<INTEGER>eARRAY<LONG>. -
summary:
DOUBLEvalore a cui associare e aggregare per ogni chiave. -
lgNomEntries: valore letterale facoltativo
INTEGERche specifica il log-base-2 delle voci nominale. Deve essere compreso tra 4 e 26 inclusi. Il valore predefinito è 12 (4.096 bucket). I valori più elevati offrono una maggiore precisione, ma usano più memoria. -
mode: valore letterale facoltativo
STRINGche specifica la modalità di aggregazione per i riepiloghi. Valori validi:'sum','min','max','alwaysone'. Il valore predefinito è'sum'.
Restituzioni
Valore BINARY contenente il TupleSketch compatto serializzato con riepiloghi doppi.
Note
-
NULLi valori chiave o di riepilogo vengono ignorati durante l'aggregazione. - Le stringhe vuote, le matrici di byte vuote e le matrici vuote vengono ignorate per le chiavi.
- I
lgNomEntriesparametri emodedevono essere valori costanti. - Usare tuple_sketch_estimate_double per ottenere la stima del conteggio distinto.
- Usare tuple_sketch_summary_double per ottenere il valore di riepilogo aggregato.
Messaggi di errore
Esempi
-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0
-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0