Partilhar via


tuple_sketch_agg_double função de agregação

Aplica-se a:sim Databricks Runtime 18.1 e superiores

Cria um TupleSketch Datasketches a partir de pares-chave-valor onde as chaves são usadas para contagem distinta e os valores de resumo duplo são agregados de acordo com o modo especificado.

Sintaxe

tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • chave: A expressão para contagem de valores únicos. Os tipos aceites são INTEGER, LONG, FLOAT, DOUBLE, STRING, BINARY, ARRAY<INTEGER>, e ARRAY<LONG>.
  • Resumo: Um DOUBLE valor a ser associado e agregado para cada chave.
  • lgNomEntrries: Um literal opcional INTEGER que especifica a base logarítmica 2 das entradas nominais. Deve ter entre 4 e 26 anos, inclusive. O valor padrão é 12 (4.096 baldes). Valores mais altos proporcionam melhor precisão, mas consomem mais memória.
  • modo: Um literal opcional STRING que especifica o modo de agregação para resumos. Valores válidos: 'sum', 'min', 'max', 'alwaysone'. A predefinição é 'sum'.

Devoluções

Um BINARY valor contendo o TupleSketch compacto serializado com resumos duplos.

Observações

  • NULL Os valores de chave ou de resumo são ignorados durante a agregação.
  • Strings vazias, arrays de bytes vazios e arrays vazios são ignorados para as chaves.
  • Os lgNomEntries parâmetros e mode devem ser valores constantes.
  • Use tuple_sketch_estimate_double para obter a estimativa de contagem específica.
  • Use tuple_sketch_summary_double para obter o valor agregado do sumário.

Mensagens de erro

Exemplos

-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0

-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0