Udostępnij przez


avg

Zwraca średnią wartości w grupie.

Składnia

from pyspark.sql import functions as sf

sf.avg(col)

Parametry

Parameter Typ Description
col pyspark.sql.Column lub nazwa kolumny Kolumna docelowa do obliczenia.

Zwraca

pyspark.sql.Column: kolumna dla obliczonych wyników.

Przykłady

Przykład 1. Obliczanie średniego wieku

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
|     8.5|
+--------+

Przykład 2. Obliczanie średniego wieku przy użyciu wartości None

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
|     3.0|
+--------+