avg
집계 함수
적용 대상: Databricks SQL 검사 예 Databricks Runtime
그룹의 값에서 계산된 평균을 반환합니다. 이 함수는 평균 집계 함수의 동의어입니다.
구문
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
이 함수는 절을 사용하여 OVER
창 함수로 호출할 수도 있습니다.
인수
expr
: 숫자 또는 간격으로 계산되는 식입니다.cond
: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.
반환
결과 형식은 인수에 대해 로 계산됩니다.
DECIMAL(p, s)
: 결과 형식은 입니다DECIMAL(p + 4, s + 4)
. DECIMAL의 최대 정밀도에 도달하면 상당한 자릿수의 손실을 방지하기 위해 스케일링 증가가 제한됩니다.- year-month 간격: 결과는 입니다
INTERVAL YEAR TO MONTH
. - 일 시간 간격: 결과는 입니다
INTERVAL DAY TO SECOND
. - 다른 모든 경우 결과는 DOUBLE입니다.
그룹 내의 Null은 무시됩니다. 그룹이 비어 있거나 null로만 구성된 경우 결과는 NULL입니다.
가 지정된 경우 DISTINCT
중복 항목이 제거된 후 평균이 계산됩니다.
결과가 결과 형식을 오버플로하면 Azure Databricks에서 ARITHMETIC_OVERFLOW 오류가 발생합니다. NULL을 반환하려면 대신 try_avg 사용합니다.
Warning
Databricks Runtime에서 spark.sql.ansi.enabled 가 false
이면 오버플로가 오류 대신 를 반환합니다 NULL
.
예
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION