Fonction d’agrégation sum
S’applique à : Databricks SQL Databricks Runtime
Retourne la somme calculée à partir des valeurs d’un groupe.
Syntaxe
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER
.
Arguments
expr
: Expression qui prend une valeur numérique ou un intervalle.cond
: expression booléenne facultative filtrant les lignes utilisées pour l’agrégation.
Retours
Si expr
est un type nombre intégral, une valeur BIGINT
.
Si expr
est DECIMAL(p, s)
, le résultat est DECIMAL(p + min(10, 31-p), s)
.
Si expr
est un intervalle, le type de résultat correspond à expr
.
Sinon, un DOUBLE
.
Si DISTINCT
est spécifié, seules les valeurs uniques sont additionnées.
Si le résultat dépasse le type de résultat, Databricks SQL génère une erreur ARITHMETIC_OVERFLOW.
Pour retourner NULL
à la place, utilisez try_sum.
Avertissement
Dans Databricks Runtime, si spark.sql.ansi.enabled est false
, un dépassement de BIGINT
ne provoque pas d’erreur, mais « enveloppe » le résultat à la place.
Exemples
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW