Teilen über


Bedeuten

Gibt den Mittelwert der Werte in einer Gruppe zurück. Ein Alias von avg.

Syntax

from pyspark.sql import functions as sf

sf.mean(col)

Die Parameter

Parameter Typ Description
col pyspark.sql.Column oder Spaltenname Zielspalte, für die berechnet werden soll.

Rückkehr

pyspark.sql.Column: die Spalte für berechnete Ergebnisse.

Examples

Beispiel 1: Berechnen des Durchschnittsalters

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     8.5|
+--------+

Beispiel 2: Berechnen des Durchschnittsalters mit "Keine"

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     3.0|
+--------+