hll_sketch_estimate
函式
適用於: Databricks SQL Databricks Runtime 13.3 LTS 和更新版本
此函式會利用 HyperLogLog 演演算法來計算指定數據行中唯一值數目的概率近似值,並取用二進位表示法,稱為hll_sketch_agg函式先前產生的草圖緩衝區,並以大整數傳回結果。
hll_union和hll_union_agg函式也可以藉由取用和合併這些緩衝區作為輸入,將草圖結合在一起。
實作會使用 Apache Datasketches 連結庫。 如需詳細資訊,請參閱 HLL 。
語法
hll_sketch_estimate ( expr )
引數
expr
BINARY
:包含hll_sketch_agg所產生草圖的表達式。
傳回
BIGINT
值,這是輸入草圖所表示的近似相異計數。
範例
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3