Sdílet prostřednictvím


avg agregační funkce

Platí pro:zaškrtnutá možnost Ano , kontrola Databricks SQL označená ano Databricks Runtime

Vrátí střední hodnotu vypočítanou z hodnot skupiny. Tato funkce je synonymem pro střední agregační funkci.

Syntaxe

avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]

Tuto funkci lze také vyvolat jako funkci okna pomocí klauzule OVER .

Argumenty

  • expr: Výraz, který se vyhodnotí jako číselný nebo interval.
  • cond: Volitelný logický výraz filtrující řádky použité pro agregaci.

Vrátí

Typ výsledku se vypočítá jako pro argumenty:

  • DECIMAL(p, s): Typ výsledku je a DECIMAL(p + 4, s + 4). Pokud je dosaženo maximální přesnosti funkce DECIMAL, bude zvýšení měřítka omezeno, aby nedošlo ke ztrátě platných číslic.
  • year-month interval: Výsledek je .INTERVAL YEAR TO MONTH
  • denní časový interval: Výsledek je INTERVAL DAY TO SECOND.
  • Ve všech ostatních případech je výsledkem double.

Hodnoty Null v rámci skupiny se ignorují. Pokud je skupina prázdná nebo se skládá pouze z hodnot null, výsledek je NULL.

Pokud DISTINCT je zadána hodnota , průměr se vypočítá po odebrání duplicit.

Pokud výsledek přeteče typ výsledku, Azure Databricks vyvolá ARITHMETIC_OVERFLOW chybu. Pokud chcete místo toho vrátit hodnotu NULL, použijte try_avg.

Upozornění

Pokud je falsev Modulu runtime Databricks hodnota spark.sql.ansi.enabled , vrátí NULL se místo chyby přetečení.

Příklady

> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
 1-6

-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 NULL

-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 Error: CANNOT_CHANGE_DECIMAL_PRECISION