Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Si applica a:
Databricks Runtime 18.1 e versioni successive
Crea un oggetto Datasketches TupleSketch da coppie chiave-valore in cui le chiavi vengono usate per il conteggio distinto e i valori di riepilogo integer vengono aggregati in base alla modalità specificata.
Sintassi
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
key: espressione per il conteggio di valori univoci. I tipi accettati sono
INTEGER,LONG,FLOATDOUBLE,STRING,BINARY, ,ARRAY<INTEGER>eARRAY<LONG>. -
summary:
INTEGERvalore a cui associare e aggregare per ogni chiave. -
lgNomEntries: valore letterale facoltativo
INTEGERche specifica il log-base-2 delle voci nominale. Deve essere compreso tra 4 e 26 inclusi. Il valore predefinito è 12 (4.096 bucket). I valori più elevati offrono una maggiore precisione, ma usano più memoria. -
mode: valore letterale facoltativo
STRINGche specifica la modalità di aggregazione per i riepiloghi. Valori validi:'sum','min','max','alwaysone'. Il valore predefinito è'sum'.
Restituzioni
Valore BINARY contenente il TupleSketch compatto serializzato con riepiloghi integer.
Note
-
NULLi valori chiave o di riepilogo vengono ignorati durante l'aggregazione. - Le stringhe vuote, le matrici di byte vuote e le matrici vuote vengono ignorate per le chiavi.
- I
lgNomEntriesparametri emodedevono essere valori costanti. - Usare tuple_sketch_estimate_integer per ottenere la stima del conteggio distinto.
- Usare tuple_sketch_summary_integer per ottenere il valore di riepilogo aggregato.
Messaggi di errore
Esempi
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6