다음을 통해 공유


avg

그룹의 값 평균을 반환합니다.

문법

from pyspark.sql import functions as sf

sf.avg(col)

매개 변수

매개 변수 유형 Description
col pyspark.sql.Column 또는 열 이름 계산할 대상 열입니다.

Returns

pyspark.sql.Column: 계산된 결과의 열입니다.

예시

예제 1: 평균 연령 계산

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
|     8.5|
+--------+

예제 2: 없음을 사용하여 평균 연령 계산

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
|     3.0|
+--------+