hll_sketch_estimate
-Funktion
Gilt für: Databricks SQL Databricks Runtime 13.3 LTS und höher
Diese Funktion verwendet den HyperLogLog-Algorithmus, um eine probabilistische Approximation der Anzahl eindeutiger Werte in einer bestimmten Spalte zu zählen, wobei eine binäre Darstellung verwendet wird, die als Skizzenpuffer bezeichnet wird, der zuvor von der hll_sketch_agg-Funktion generiert wurde, und das Ergebnis als große ganze Zahl zurückgegeben wird.
Die Funktionen hll_union und hll_union_agg können auch Skizzen kombinieren, indem diese Puffer als Eingaben genutzt und zusammengeführt werden.
Die Implementierung verwendet die Apache DataSketches-Bibliothek. Weitere Informationen finden Sie unter HLL.
Syntax
hll_sketch_estimate ( expr )
Argumente
expr
: EinBINARY
-Ausdruck, der eine von der hll_sketch_agg-Funktion generierte Skizze enthält
Gibt zurück
Ein BIGINT
-Wert, der die durch die Eingabeskizze dargestellte ungefähre eindeutige Anzahl darstellt.
Beispiele
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3