Funkce hll_sketch_estimate
Platí pro: Databricks SQL Databricks Runtime 13.3 LTS a vyšší
Tato funkce využívá algoritmus HyperLogLog ke spočítání pravděpodobnostní aproximace počtu jedinečných hodnot v daném sloupci, přičemž využívá binární reprezentaci známou jako vyrovnávací paměť skic dříve vygenerovanou funkcí hll_sketch_agg a vrací výsledek jako velké celé číslo.
Funkce hll_union a hll_union_agg můžou také kombinovat skicy dohromady tím, že tyto vyrovnávací paměti spotřebovávají a slučují jako vstupy.
Implementace používá knihovnu Apache Datasketches. Další informace najdete v HLL.
Syntaxe
hll_sketch_estimate ( expr )
Argumenty
expr
: VýrazBINARY
s náčrtkem vygenerovaným hll_sketch_agg.
Návraty
Hodnota BIGINT
, která představuje přibližný počet jedinečných představovaných vstupním skicam.
Příklady
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3