Teilen über


sum

Gibt die Summe aller Werte im Ausdruck zurück.

Syntax

from pyspark.sql import functions as sf

sf.sum(col)

Die Parameter

Parameter Typ Description
col pyspark.sql.Column oder Spaltenname Zielspalte, für die berechnet werden soll.

Rückkehr

pyspark.sql.Column: die Spalte für berechnete Ergebnisse.

Examples

Beispiel 1: Berechnen der Summe von Werten in einer Spalte

from pyspark.sql import functions as sf
df = spark.range(10)
df.select(sf.sum(df["id"])).show()
+-------+
|sum(id)|
+-------+
|     45|
+-------+

Beispiel 2: Verwenden eines Plusausdrucks zum Berechnen der Summe

from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.sum(sf.col("A") + sf.col("B"))).show()
+------------+
|sum((A + B))|
+------------+
|          10|
+------------+

Beispiel 3: Berechnen der Summe von Altersstufen mit "None"

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.sum("age")).show()
+--------+
|sum(age)|
+--------+
|       6|
+--------+