Sdílet prostřednictvím


tuple_sketch_agg_integer agregační funkce

Platí pro:check označený ano Databricks Runtime 18.1 a novější

Vytvoří objekt TupleSketch Datasketch z párů klíč-hodnota, kde se klíče používají pro odlišné počítání a celočíselné souhrnné hodnoty jsou agregovány podle zadaného režimu.

Syntaxe

tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )

Arguments

  • key: Výraz pro počítání jedinečných hodnot. Přijaté typy jsou INTEGER, , FLOATSTRINGDOUBLEBINARYLONG, ARRAY<INTEGER>, a .ARRAY<LONG>
  • summary: Hodnota INTEGER , která se má přidružit a agregovat pro každý klíč.
  • lgNomEntries: Volitelný INTEGER literál určující log-base-2 nominálních položek. Musí být mezi 4 a 26 včetně. Výchozí hodnota je 12 (4 096 kbelíků). Vyšší hodnoty poskytují vyšší přesnost, ale využívají více paměti.
  • mode: Volitelný STRING literál určující režim agregace pro souhrny. Platné hodnoty: 'sum', 'min', 'max''alwaysone'. Výchozí hodnota je 'sum'.

Návraty

Hodnota BINARY obsahující serializovaný kompaktní tupleSketch se souhrny celých čísel.

Poznámky

  • NULL hodnoty klíče nebo souhrnu se během agregace ignorují.
  • Prázdné řetězce, prázdné bajtové pole a prázdná pole se pro klíče ignorují.
  • mode Parametry lgNomEntries musí být konstantní hodnoty.
  • K získání jedinečného odhadu počtu použijte tuple_sketch_estimate_integer .
  • K získání agregované souhrnné hodnoty použijte tuple_sketch_summary_integer .

Chybové zprávy

Příklady

-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0

-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6