sum 집계 함수(Databricks SQL)

그룹의 값에서 계산된 합계를 반환합니다.

구문

sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

인수

  • expr: 숫자 또는 간격으로 평가되는 식입니다.
  • cond: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.

반환

expr이 정수 형식이면 BIGINT입니다. exprDECIMAL(p, s)인 경우, 결과는 DECIMAL(p + min(10, 31-p), s)입니다. expr이 간격인 경우 결과 형식은 expr과 일치합니다.

그렇지 않으면 DOUBLE입니다.

DISTINCT가 지정되면 고유한 값만 합산됩니다.

결과가 결과 형식을 오버플로하면 Databricks SQL에서 ARITHMETIC_OVERFLOW 오류가 발생합니다. NULL을 반환하려면 대신 try_sum을 사용합니다.

예제

> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
 30

> SELECT sum(col) FILTER(WHERE col <15)
    FROM VALUES (5), (10), (15) AS tab(col);
 15

> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
 30

> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
 25

> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
 NULL

-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 NULL

-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW

-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
  NULL

-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW