Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Retourne la somme calculée à partir des valeurs d’un groupe et le résultat est nul en cas de dépassement de capacité.
Syntaxe
from pyspark.sql import functions as sf
sf.try_sum(col)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
col |
pyspark.sql.Column ou nom de colonne |
Colonne cible sur laquelle calculer. |
Examples
Exemple 1 : Calcul de la somme des valeurs dans une colonne
from pyspark.sql import functions as sf
spark.range(10).select(sf.try_sum("id")).show()
+-----------+
|try_sum(id)|
+-----------+
| 45|
+-----------+
Exemple 2 : Utilisation d’une expression plus ensemble pour calculer la somme
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.try_sum(sf.col("A") + sf.col("B"))).show()
+----------------+
|try_sum((A + B))|
+----------------+
| 10|
+----------------+
Exemple 3 : Calcul de la somme des âges avec Aucun
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.try_sum("age")).show()
+------------+
|try_sum(age)|
+------------+
| 6|
+------------+