Partilhar via


tuple_sketch_agg_integer função de agregação

Aplica-se a:sim Databricks Runtime 18.1 e superiores

Cria um TupleSketch Datasketches a partir de pares-chave-valor onde as chaves são usadas para contagem distinta e os valores resumidos inteiros são agregados de acordo com o modo especificado.

Sintaxe

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • chave: A expressão para contagem de valores únicos. Os tipos aceites são INTEGER, LONG, FLOAT, DOUBLE, STRING, BINARY, ARRAY<INTEGER>, e ARRAY<LONG>.
  • Resumo: Um INTEGER valor a ser associado e agregado para cada chave.
  • lgNomEntrries: Um literal opcional INTEGER que especifica a base logarítmica 2 das entradas nominais. Deve ter entre 4 e 26 anos, inclusive. O valor padrão é 12 (4.096 baldes). Valores mais altos proporcionam melhor precisão, mas consomem mais memória.
  • modo: Um literal opcional STRING que especifica o modo de agregação para resumos. Valores válidos: 'sum', 'min', 'max', 'alwaysone'. A predefinição é 'sum'.

Devoluções

Um BINARY valor que contém o TupleSketch compacto serializado com resumos inteiros.

Observações

  • NULL Os valores de chave ou de resumo são ignorados durante a agregação.
  • Strings vazias, arrays de bytes vazios e arrays vazios são ignorados para as chaves.
  • Os lgNomEntries parâmetros e mode devem ser valores constantes.
  • Use tuple_sketch_estimate_integer para obter a estimativa de contagem específica.
  • Use tuple_sketch_summary_integer para obter o valor agregado do resumo.

Mensagens de erro

Exemplos

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6