Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt die Summe aus Werten einer Gruppe zurück, wobei das Ergebnis null ist bei Überlauf.
Syntax
from pyspark.sql import functions as sf
sf.try_sum(col)
Die Parameter
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column oder Spaltenname |
Zielspalte, für die berechnet werden soll. |
Examples
Beispiel 1: Berechnen der Summe von Werten in einer Spalte
from pyspark.sql import functions as sf
spark.range(10).select(sf.try_sum("id")).show()
+-----------+
|try_sum(id)|
+-----------+
| 45|
+-----------+
Beispiel 2: Verwenden eines Plusausdrucks zum Berechnen der Summe
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.try_sum(sf.col("A") + sf.col("B"))).show()
+----------------+
|try_sum((A + B))|
+----------------+
| 10|
+----------------+
Beispiel 3: Berechnen der Summe von Altersstufen mit "None"
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.try_sum("age")).show()
+------------+
|try_sum(age)|
+------------+
| 6|
+------------+