Função de agregação sum
Aplica-se a: SQL do Databricks Runtime do Databricks
Retorna a soma calculada a partir dos valores de um grupo.
Sintaxe
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Essa função também pode ser invocada como uma função de janela usando a cláusula OVER
.
Argumentos
expr
: uma expressão avaliada como um intervalo ou um numérico.cond
: Uma expressão booliana opcional que filtra as linhas usadas para agregação.
Retornos
Se expr
for um tipo de número integral, um BIGINT
.
Se expr
for DECIMAL(p, s)
, o resultado é DECIMAL(p + min(10, 31-p), s)
.
Se expr
for um intervalo, o tipo de resultado corresponde a expr
.
Caso contrário, um DOUBLE
.
Se DISTINCT
for especificado, somente os valores exclusivos serão somados.
Se o resultado estoura o tipo de resultado, o SQL do Databricks gera um erro de ARITHMETIC_OVERFLOW.
Para retornar um NULL
, use try_sum.
Aviso
No Databricks Runtime, se spark.sql.ansi.enabled for false
, um estouro de BIGINT
não causa um erro, mas “encapsula” o resultado.
Exemplos
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW