Share via


sum 集計関数

適用対象:check marked yes Databricks SQL check marked yes Databricks Runtime

グループの値から計算された合計を返します。

構文

sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

この関数は、OVER 句を使用して ウィンドウ 関数として呼び出すこともできます。

引数

  • expr: 数値または間隔に評価される式。
  • cond: 集計に使用される行をフィルター処理するブール式 (省略可能)。

返品

expr が整数型の場合は BIGINT です。 exprDECIMAL(p, s) の場合、結果は DECIMAL(p + min(10, 31-p), s) です。 expr が間隔の場合、結果の型は expr と一致します。

それ以外の場合 DOUBLE になります。

DISTINCT が指定されている場合は、一意の値だけが合計されます。

結果が結果の型をオーバーフローした場合、Databricks SQL で ARITHMETIC_OVERFLOW エラーが発生します。 代わりに NULL を返すには、try_sum を使用します。

警告

Databricks Runtime で spark.sql.ansi.enabledfalse の場合、BIGINT のオーバーフローがエラーの原因となることはありませんが、結果がオーバーフローによって "ラップ" されます。

> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
 30

> SELECT sum(col) FILTER(WHERE col <15)
    FROM VALUES (5), (10), (15) AS tab(col);
 15

> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
 30

> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
 25

> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
 NULL

-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 NULL

-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW

-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
  NULL

-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW