Udostępnij przez


tuple_sketch_agg_double funkcja agregacji

Dotyczy:sprawdzanie oznaczone jako tak Databricks Runtime 18.1 i nowszych

Tworzy krotki Datasketches z par klucz-wartość, w których klucze są używane do odrębnego zliczania i podwójne wartości podsumowania są agregowane zgodnie z określonym trybem.

Składnia

tuple_sketch_agg_double ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: wyrażenie dla zliczania unikatowych wartości. Akceptowane typy to INTEGER, , LONG, DOUBLEFLOATBINARYSTRING, ARRAY<INTEGER>i .ARRAY<LONG>
  • podsumowanie: DOUBLE wartość, z która ma być skojarzona i agregowana dla każdego klucza.
  • lgNomEntries: opcjonalny INTEGER literał określający log-base-2 wpisów nominalnych. Musi należeć do przedziału od 4 do 26 włącznie. Wartość domyślna to 12 (4096 zasobników). Wyższe wartości zapewniają lepszą dokładność, ale używają większej ilości pamięci.
  • tryb: opcjonalny STRING literał określający tryb agregacji dla podsumowań. Prawidłowe wartości: 'sum', , 'min''max', 'alwaysone'. Wartość domyślna to 'sum'.

Zwraca

Wartość zawierająca BINARY serializowaną kompaktową krotkęSketch z podwójnymi podsumowaniami.

Notatki

  • NULL wartości klucza lub podsumowania są ignorowane podczas agregacji.
  • Puste ciągi, puste tablice bajtów i puste tablice są ignorowane dla kluczy.
  • Parametry lgNomEntries i mode muszą być wartościami stałymi.
  • Użyj tuple_sketch_estimate_double , aby uzyskać unikatowe oszacowanie liczby.
  • Użyj tuple_sketch_summary_double , aby uzyskać zagregowaną wartość podsumowania.

Komunikaty o błędach

Przykłady

-- Create sketch with sum mode (default)
> SELECT tuple_sketch_estimate_double(tuple_sketch_agg_double(key, summary, 12, 'sum')) FROM VALUES (1, 5.0D), (1, 1.0D), (2, 2.0D), (2, 3.0D), (3, 2.2D) tab(key, summary);
3.0

-- Get aggregated summary
> SELECT tuple_sketch_summary_double(tuple_sketch_agg_double(key, summary)) FROM VALUES (1, 1.0D), (1, 2.0D), (2, 3.0D) tab(key, summary);
6.0