Sdílet prostřednictvím


Funkce hll_sketch_estimate

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime 13.3 LTS a vyšší

Tato funkce využívá algoritmus HyperLogLog ke spočítání pravděpodobnostní aproximace počtu jedinečných hodnot v daném sloupci, přičemž využívá binární reprezentaci známou jako vyrovnávací paměť skic dříve vygenerovanou funkcí hll_sketch_agg a vrací výsledek jako velké celé číslo.

Funkce hll_union a hll_union_agg můžou také kombinovat skicy dohromady tím, že tyto vyrovnávací paměti spotřebovávají a slučují jako vstupy.

Implementace používá knihovnu Apache Datasketches. Další informace najdete v HLL.

Syntaxe

hll_sketch_estimate ( expr )

Argumenty

Návraty

Hodnota BIGINT , která představuje přibližný počet jedinečných představovaných vstupním skicam.

Příklady

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3