sum funkcja agregacji

Dotyczy:check marked yes Databricks SQL check marked yes Databricks Runtime

Zwraca sumę obliczoną na podstawie wartości grupy.

Składnia

sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Tę funkcję można również wywołać jako funkcję okna przy użyciu klauzuli OVER .

Argumenty

  • expr: wyrażenie, które daje w wyniku wartość liczbową lub interwałową.
  • cond: opcjonalne wyrażenie logiczne filtrujące wiersze używane do agregacji.

Powroty

Jeśli expr jest typem liczb całkowitych, a .BIGINT Jeśli expr wynik to DECIMAL(p, s)DECIMAL(p + min(10, 31-p), s). Jeśli expr parametr jest interwałem, typ wyniku jest zgodny z exprparametrem .

W przeciwnym razie element DOUBLE.

Jeśli DISTINCT określono tylko unikatowe wartości, są sumowane.

Jeśli wynik przepełni typ wyniku Databricks SQL zgłasza błąd ARITHMETIC_OVERFLOW . Aby zamiast tego NULLużyć try_sum.

Ostrzeżenie

W środowisku Databricks Runtime, jeśli parametr spark.sql.ansi.enabled to false, przepełnienie BIGINT nie powoduje błędu, ale "opakowuje" wynik.

Przykłady

> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
 30

> SELECT sum(col) FILTER(WHERE col <15)
    FROM VALUES (5), (10), (15) AS tab(col);
 15

> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
 30

> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
 25

> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
 NULL

-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 NULL

-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW

-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
  NULL

-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW