avg
агрегатная функция
Область применения: Databricks SQL Databricks Runtime
Возвращает среднее значение, вычисленное на основе значений группы. Эта функция является синонимом средней агрегатной функции.
Синтаксис
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
Эту функцию также можно вызвать как оконную функцию с помощью OVER
предложения .
Аргументы
expr
: выражение, результатом которого является число или интервал.cond
: необязательное логическое выражение, фильтрующее строки, используемые для агрегирования.
Возвращает
Тип результата вычисляется как для аргументов:
DECIMAL(p, s)
: тип результата — .DECIMAL(p + 4, s + 4)
Если достигнута максимальная точность для DECIMAL, увеличение масштаба будет ограничено, чтобы избежать потери значительных цифр.- Интервал года и месяца: результатом
INTERVAL YEAR TO MONTH
является . - интервал дня и времени: результатом
INTERVAL DAY TO SECOND
является . - Во всех остальных случаях результатом является DOUBLE.
Значения NULL в группе игнорируются. Если группа пуста или состоит только из значений NULL, результатом будет NULL.
Если DISTINCT
задано значение , среднее вычисляется после удаления дубликатов.
Если результат превышает тип результата, Azure Databricks выдает ошибку ARITHMETIC_OVERFLOW . Чтобы вернуть значение NULL, используйте try_avg.
Предупреждение
Если в Databricks Runtime имеет значение false
spark.sql.ansi.enabled , вместо ошибки возвращается NULL
переполнение.
Примеры
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION