Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função de agregação
Aplica-se a:
SQL do Databricks
Databricks Runtime
Retorna a média calculada dos valores de um grupo. Essa função é um sinônimo para mean a função de agregação.
Sintaxe
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
Essa função também pode ser invocada como uma função de janela usando a cláusula OVER.
Argumentos
-
expr: uma expressão avaliada como um intervalo ou um número. -
cond: uma expressão booliana opcional que filtra as linhas usadas para agregação.
Retornos
O tipo de resultado é calculado como para os argumentos:
-
DECIMAL(p, s): o tipo de resultado é umDECIMAL(p + 4, s + 4). Se a precisão máxima forDECIMALatingida, o aumento na escala será limitado para evitar a perda de dígitos significativos. - Intervalo de ano-mês: o resultado será um
INTERVAL YEAR TO MONTH. - Intervalo de dia-hora, o resultado será um
INTERVAL DAY TO SECOND. - Em todos os outros casos, o resultado é um
DOUBLE.
Nulos dentro do grupo são ignorados. Se um grupo estiver vazio ou consistir apenas em nulos, o resultado será NULL.
Se DISTINCT for especificado, a média será calculada depois que as duplicatas tiverem sido removidas.
Se o resultado estoura o tipo de resultado, o Azure Databricks gera um erro de ARITHMETIC_OVERFLOW. Para retornar um NULL em vez disso, use try_avg.
Aviso
No Databricks Runtime, se spark.sql.ansi.enabled for false, um estouro retornará NULL em vez de um erro.
Exemplos
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION