Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função de agregação
Aplica-se a:
Databricks Runtime 18.1 e superior
Cria um Datasketches TupleSketch de pares chave-valor em que as chaves são usadas para contagem distinta e valores de resumo inteiro são agregados de acordo com o modo especificado.
Sintaxe
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Argumentos
-
chave: a expressão para contagem de valores exclusiva. Os tipos aceitos são
INTEGER, ,LONG,FLOAT,DOUBLE,STRING,BINARY, eARRAY<INTEGER>ARRAY<LONG>. -
resumo: um
INTEGERvalor a ser associado e agregado para cada chave. -
lgNomEntries: um literal opcional
INTEGERque especifica o log-base-2 de entradas nominais. Deve estar entre 4 e 26, inclusive. O padrão é 12 (4.096 buckets). Valores mais altos fornecem melhor precisão, mas usam mais memória. -
modo: um literal opcional
STRINGque especifica o modo de agregação para resumos. Valores válidos:'sum', ,'min''max','alwaysone'. O padrão é'sum'.
Devoluções
Um BINARY valor que contém o TupleSketch compacto serializado com resumos inteiros.
Anotações
-
NULLvalores de chave ou resumo são ignorados durante a agregação. - Cadeias de caracteres vazias, matrizes de bytes vazias e matrizes vazias são ignoradas para chaves.
- Os
lgNomEntriesparâmetros e devemmodeser valores constantes. - Use tuple_sketch_estimate_integer para obter a estimativa de contagem distinta.
- Use tuple_sketch_summary_integer para obter o valor de resumo agregado.
Mensagens de erro
Exemplos
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6