Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op:
Databricks Runtime 18.1 en hoger
Hiermee maakt u een Datasketches TupleSketch van sleutel-waardeparen waarbij sleutels worden gebruikt voor afzonderlijke tellingen en samenvattingswaarden voor gehele getallen worden samengevoegd volgens de opgegeven modus.
Syntaxis
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
sleutel: De expressie voor het tellen van unieke waarden. Geaccepteerde typen zijn
INTEGER, ,LONG,FLOAT,DOUBLESTRING, ,BINARY, , en .ARRAY<LONG>ARRAY<INTEGER> -
samenvatting: Een
INTEGERwaarde die moet worden gekoppeld aan en geaggregeerd voor elke sleutel. -
lgNomEntries: Een optionele letterlijke
INTEGERwaarde die het log-base-2 van nominale vermeldingen aangeeft. Moet tussen 4 en 26 liggen, inclusief. De standaardwaarde is 12 (4.096 buckets). Hogere waarden bieden een betere nauwkeurigheid, maar gebruiken meer geheugen. -
modus: Een optionele letterlijke
STRINGwaarde die de aggregatiemodus voor samenvattingen aangeeft. Geldige waarden:'sum','min','max', .'alwaysone'De standaardwaarde is'sum'.
Retouren
Een BINARY waarde die de geserialiseerde compacte TupleSketch met gehele getallen bevat.
Opmerkingen
-
NULLsleutel- of samenvattingswaarden worden genegeerd tijdens de aggregatie. - Lege tekenreeksen, lege bytematrices en lege matrices worden genegeerd voor sleutels.
- De
lgNomEntriesparametersmodemoeten constante waarden zijn. - Gebruik tuple_sketch_estimate_integer om de afzonderlijke schatting van het aantal te verkrijgen.
- Gebruik tuple_sketch_summary_integer om de geaggregeerde samenvattingswaarde te verkrijgen.
Foutberichten
Voorbeelden
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6