Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Se aplica a:
Databricks Runtime 18.1 y versiones posteriores
Crea un objeto Datasketches TupleSketch a partir de pares clave-valor donde las claves se usan para distintos valores de resumen de recuento e enteros se agregan según el modo especificado.
Sintaxis
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Argumentos
-
key: expresión para el recuento de valores únicos. Los tipos aceptados son
INTEGER,LONG,FLOAT,STRINGDOUBLE, ,BINARY,ARRAY<INTEGER>yARRAY<LONG>. -
summary:
INTEGERvalor al que se va a asociar y agregar para cada clave. -
lgNomEntries: literal opcional
INTEGERque especifica el log-base-2 de entradas nominales. Debe estar comprendido entre 4 y 26, ambos incluidos. El valor predeterminado es 12 (4096 cubos). Los valores más altos proporcionan una mayor precisión, pero usan más memoria. -
mode: literal opcional
STRINGque especifica el modo de agregación para los resúmenes. Valores válidos:'sum','min','max','alwaysone'. El valor predeterminado es'sum'.
Devoluciones
Valor BINARY que contiene el tupleSketch compacto serializado con resúmenes enteros.
Notas
-
NULLlos valores de clave o resumen se omiten durante la agregación. - Las cadenas vacías, las matrices de bytes vacías y las matrices vacías se omiten para las claves.
- Los
lgNomEntriesparámetros ymodedeben ser valores constantes. - Use tuple_sketch_estimate_integer para obtener la estimación de recuentos distintas.
- Use tuple_sketch_summary_integer para obtener el valor de resumen agregado.
Mensajes de error
Examples
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6