Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de changer d’annuaire.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer d’annuaire.
Retourne la moyenne des valeurs d’un groupe. Alias de avg.
Syntaxe
from pyspark.sql import functions as sf
sf.mean(col)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
col |
pyspark.sql.Column ou nom de colonne |
Colonne cible sur laquelle calculer. |
Retours
pyspark.sql.Column: colonne pour les résultats calculés.
Examples
Exemple 1 : calcul de l’âge moyen
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
| 8.5|
+--------+
Exemple 2 : Calcul de l’âge moyen avec Aucun
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
| 3.0|
+--------+