Partager via


sum

Retourne la somme de toutes les valeurs de l’expression.

Syntaxe

from pyspark.sql import functions as sf

sf.sum(col)

Paramètres

Paramètre Type Descriptif
col pyspark.sql.Column ou nom de colonne Colonne cible sur laquelle calculer.

Retours

pyspark.sql.Column: colonne pour les résultats calculés.

Examples

Exemple 1 : Calcul de la somme des valeurs dans une colonne

from pyspark.sql import functions as sf
df = spark.range(10)
df.select(sf.sum(df["id"])).show()
+-------+
|sum(id)|
+-------+
|     45|
+-------+

Exemple 2 : Utilisation d’une expression plus ensemble pour calculer la somme

from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.sum(sf.col("A") + sf.col("B"))).show()
+------------+
|sum((A + B))|
+------------+
|          10|
+------------+

Exemple 3 : Calcul de la somme des âges avec Aucun

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.sum("age")).show()
+--------+
|sum(age)|
+--------+
|       6|
+--------+