Compartilhar via


Função de agregação tuple_sketch_agg_integer

Aplica-se a:check marked yes Databricks Runtime 18.1 e superior

Cria um Datasketches TupleSketch de pares chave-valor em que as chaves são usadas para contagem distinta e valores de resumo inteiro são agregados de acordo com o modo especificado.

Sintaxe

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Argumentos

  • chave: a expressão para contagem de valores exclusiva. Os tipos aceitos sãoINTEGER, , LONG, FLOAT, DOUBLE, STRING, BINARY, e ARRAY<INTEGER>ARRAY<LONG>.
  • resumo: um INTEGER valor a ser associado e agregado para cada chave.
  • lgNomEntries: um literal opcional INTEGER que especifica o log-base-2 de entradas nominais. Deve estar entre 4 e 26, inclusive. O padrão é 12 (4.096 buckets). Valores mais altos fornecem melhor precisão, mas usam mais memória.
  • modo: um literal opcional STRING que especifica o modo de agregação para resumos. Valores válidos: 'sum', , 'min''max', 'alwaysone'. O padrão é 'sum'.

Devoluções

Um BINARY valor que contém o TupleSketch compacto serializado com resumos inteiros.

Anotações

  • NULL valores de chave ou resumo são ignorados durante a agregação.
  • Cadeias de caracteres vazias, matrizes de bytes vazias e matrizes vazias são ignoradas para chaves.
  • Os lgNomEntries parâmetros e devem mode ser valores constantes.
  • Use tuple_sketch_estimate_integer para obter a estimativa de contagem distinta.
  • Use tuple_sketch_summary_integer para obter o valor de resumo agregado.

Mensagens de erro

Exemplos

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6