avg
agregační funkce
Platí pro: , kontrola Databricks SQL
Databricks Runtime
Vrátí střední hodnotu vypočítanou z hodnot skupiny. Tato funkce je synonymem pro střední agregační funkci.
Syntaxe
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
Tuto funkci lze také vyvolat jako funkci okna pomocí klauzule OVER
.
Argumenty
expr
: Výraz, který se vyhodnotí jako číselný nebo interval.cond
: Volitelný logický výraz filtrující řádky použité pro agregaci.
Vrátí
Typ výsledku se vypočítá jako pro argumenty:
DECIMAL(p, s)
: Typ výsledku je aDECIMAL(p + 4, s + 4)
. Pokud je dosaženo maximální přesnosti funkce DECIMAL, bude zvýšení měřítka omezeno, aby nedošlo ke ztrátě platných číslic.- year-month interval: Výsledek je .
INTERVAL YEAR TO MONTH
- denní časový interval: Výsledek je
INTERVAL DAY TO SECOND
. - Ve všech ostatních případech je výsledkem double.
Hodnoty Null v rámci skupiny se ignorují. Pokud je skupina prázdná nebo se skládá pouze z hodnot null, výsledek je NULL.
Pokud DISTINCT
je zadána hodnota , průměr se vypočítá po odebrání duplicit.
Pokud výsledek přeteče typ výsledku, Azure Databricks vyvolá ARITHMETIC_OVERFLOW chybu. Pokud chcete místo toho vrátit hodnotu NULL, použijte try_avg.
Upozornění
Pokud je false
v Modulu runtime Databricks hodnota spark.sql.ansi.enabled , vrátí NULL
se místo chyby přetečení.
Příklady
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION