Freigeben über


hll_sketch_estimate-Funktion

Gilt für:Häkchen gesetzt ja Databricks SQL Häkchen gesetzt ja Databricks Runtime ab Version 13.3 LTS

Diese Funktion verwendet den HyperLogLog-Algorithmus, um eine probabilistische Approximation der Anzahl eindeutiger Werte in einer bestimmten Spalte zu zählen, wobei eine binäre Darstellung verwendet wird, die als Skizzenpuffer bezeichnet wird, der zuvor von der hll_sketch_agg-Funktion generiert wurde, und das Ergebnis als große ganze Zahl zurückgegeben wird.

Die Funktionen hll_union und hll_union_agg können auch Skizzen kombinieren, indem diese Puffer als Eingaben genutzt und zusammengeführt werden.

Die Implementierung verwendet die Apache DataSketches-Bibliothek. Weitere Informationen finden Sie unter HLL.

Syntax

hll_sketch_estimate ( expr )

Argumente

  • expr: Ein BINARY-Ausdruck, der eine von der hll_sketch_agg-Funktion generierte Skizze enthält

Gibt zurück

Ein BIGINT-Wert, der die durch die Eingabeskizze dargestellte ungefähre eindeutige Anzahl darstellt.

Beispiele

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3