Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
S’applique à :
Databricks Runtime 18.1 et versions ultérieures
Crée un Datasketches TupleSketch à partir de paires clé-valeur où les clés sont utilisées pour le comptage distinct et les valeurs récapitulatives entières sont agrégées en fonction du mode spécifié.
Syntaxe
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
clé : expression pour le comptage de valeurs uniques. Les types acceptés sont
INTEGER, ,LONGFLOAT,BINARYARRAY<INTEGER>DOUBLESTRINGet .ARRAY<LONG> -
résumé :
INTEGERvaleur à associer et agréger pour chaque clé. -
lgNomEntries : littéral facultatif
INTEGERspécifiant le journal-base-2 des entrées nominales. Doit être compris entre 4 et 26, inclus. La valeur par défaut est 12 (4 096 compartiments). Les valeurs plus élevées offrent une meilleure précision, mais utilisent plus de mémoire. -
mode : littéral facultatif
STRINGspécifiant le mode d’agrégation pour les résumés. Valeurs valides :'sum','min','max','alwaysone'. La valeur par défaut est'sum'.
Retours
Valeur BINARY contenant le TupleSketch compact sérialisé avec des résumés entiers.
Remarques
-
NULLles valeurs clés ou récapitulatives sont ignorées pendant l’agrégation. - Les chaînes vides, les tableaux d’octets vides et les tableaux vides sont ignorés pour les clés.
- Les
lgNomEntriesvaleurs etmodeparamètres doivent être des valeurs constantes. - Utilisez tuple_sketch_estimate_integer pour obtenir l’estimation de nombre distinct.
- Utilisez tuple_sketch_summary_integer pour obtenir la valeur récapitulative agrégée.
Messages d’erreur
Exemples
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6