次の方法で共有


意味

グループ内の値の平均を返します。 avgのエイリアス。

構文

from pyspark.sql import functions as sf

sf.mean(col)

パラメーター

パラメーター タイプ Description
col pyspark.sql.Column または列名 計算対象の列。

返品ポリシー

pyspark.sql.Column: 計算結果の列。

例示

例 1: 平均年齢の計算

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     8.5|
+--------+

例 2: なしで平均年齢を計算する

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     3.0|
+--------+