Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Platí pro:
Databricks Runtime 18.1 a novější
Vytvoří objekt TupleSketch Datasketch z párů klíč-hodnota, kde se klíče používají pro odlišné počítání a celočíselné souhrnné hodnoty jsou agregovány podle zadaného režimu.
Syntaxe
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
key: Výraz pro počítání jedinečných hodnot. Přijaté typy jsou
INTEGER, ,FLOATSTRINGDOUBLEBINARYLONG,ARRAY<INTEGER>, a .ARRAY<LONG> -
summary: Hodnota
INTEGER, která se má přidružit a agregovat pro každý klíč. -
lgNomEntries: Volitelný
INTEGERliterál určující log-base-2 nominálních položek. Musí být mezi 4 a 26 včetně. Výchozí hodnota je 12 (4 096 kbelíků). Vyšší hodnoty poskytují vyšší přesnost, ale využívají více paměti. -
mode: Volitelný
STRINGliterál určující režim agregace pro souhrny. Platné hodnoty:'sum','min','max''alwaysone'. Výchozí hodnota je'sum'.
Návraty
Hodnota BINARY obsahující serializovaný kompaktní tupleSketch se souhrny celých čísel.
Poznámky
-
NULLhodnoty klíče nebo souhrnu se během agregace ignorují. - Prázdné řetězce, prázdné bajtové pole a prázdná pole se pro klíče ignorují.
-
modeParametrylgNomEntriesmusí být konstantní hodnoty. - K získání jedinečného odhadu počtu použijte tuple_sketch_estimate_integer .
- K získání agregované souhrnné hodnoty použijte tuple_sketch_summary_integer .
Chybové zprávy
Příklady
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6