Compartir a través de


hll_sketch_estimateFunción

Se aplica a: casilla marcada como sí Databricks SQL casilla marcada como Sí Databricks Runtime 13.3 LTS y versiones posteriores

Esta función utiliza el algoritmo HyperLogLog para contar una aproximación probabilística del número de valores únicos en una columna determinada, consumiendo una representación binaria conocida como búfer de boceto generada previamente por la función hll_sketch_agg y devolviendo el resultado como un número entero grande.

Las funciones hll_union y hll_union_agg también pueden combinar bocetos mediante el consumo y combinación de estos búferes como entradas.

La implementación usa la Biblioteca Apache Datasketches. Para obtener más información, consulte HLL.

Sintaxis

hll_sketch_estimate ( expr )

Argumentos

  • expr: Una expresión BINARY que contiene un boceto generado por hll_sketch_agg.

Devoluciones

Un valor BIGINT que es el recuento distinto aproximado representado por el croquis de entrada.

Ejemplos

> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3

> SELECT hll_sketch_estimate(hll_sketch_agg(col))
    FROM VALUES (1), (1), (2), (2), (3) tab(col);
  3