Fonction d’agrégation bitmap_or_agg

S’applique à :coche marquée oui Databricks SQL case marquée oui Databricks Runtime 13.3 LTS et versions ultérieures

Renvoie le bit à bit OR de toutes les valeurs d’entrée BINARY du groupe.

La fonction est couramment utilisée pour compter le nombre de nombres entiers distincts en combinaison avec les fonctions bitmap_bucket_number(), bitmap_count(), bitmap_bit_position() et bitmap_construct_agg().

Pour agréger des bitmaps sous forme de valeurs numériques intégrales, utilisez la fonction d'agrégation bit_or(). Pour regrouper les positions des bits dans un bitmap BINARY, utilisez bitmap_construct_agg().

Syntaxe

bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]

Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER.

Arguments

  • expr : Un BINARY de longueur <= 4096 représentant une bitmap. Azure Databricks tronque les valeurs plus longues à 4 096.
  • cond : expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.

Retours

Un BINARY de longueur 4096.

Exemples

> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
 12

-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
    FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
            FROM ((SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
                     GROUP BY ALL)
                  UNION ALL
                  (SELECT bitmap_bucket_number(val) AS bucket,
                          bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
                     FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
                     GROUP BY ALL))
            GROUP BY ALL);
  8