Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Platí pro:
Databricks Runtime 18.1 a novější
Sjednocuje několik binárních reprezentací TupleSketch s celočíselnou souhrny do jediné sloučené skicy. Pomocí této funkce můžete kombinovat předem agregované náčrty z různých oddílů nebo zdrojů dat.
Syntaxe
tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )
Arguments
- skica: TupleSketch v binárním formátu s celočíselnou souhrny (například z tuple_sketch_agg_integer).
-
lgNomEntries: Volitelný
INTEGERliterál určující log-base-2 nominálních položek pro sjednocení. Musí být mezi 4 a 26 včetně. Výchozí hodnota je 12. -
mode: Volitelný
STRINGliterál určující režim agregace pro kombinování souhrnů duplicitních klíčů. Platné hodnoty:'sum','min','max''alwaysone'. Výchozí hodnota je'sum'.
Návraty
Hodnota BINARY obsahující sloučenou kolekci TupleSketch se souhrny celých čísel.
Poznámky
-
NULLBěhem agregace se ignorují vstupní skicy. - Operace sjednocení kombinuje skici i v případě, že mají různé hodnoty lgNomEntries.
- Ke sloučení přesně dvou skic použijte skalární tuple_union_integer funkci.
Chybové zprávy
Příklady
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
);
3.0