Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve la suma de todos los valores de la expresión.
Syntax
from pyspark.sql import functions as sf
sf.sum(col)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column o nombre de columna |
Columna de destino en la que se va a calcular. |
Devoluciones
pyspark.sql.Column: la columna para los resultados calculados.
Examples
Ejemplo 1: Cálculo de la suma de valores de una columna
from pyspark.sql import functions as sf
df = spark.range(10)
df.select(sf.sum(df["id"])).show()
+-------+
|sum(id)|
+-------+
| 45|
+-------+
Ejemplo 2: Uso de una expresión más conjunta para calcular la suma
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1, 2), (3, 4)], ["A", "B"])
df.select(sf.sum(sf.col("A") + sf.col("B"))).show()
+------------+
|sum((A + B))|
+------------+
| 10|
+------------+
Ejemplo 3: Calcular la suma de edades con None
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.sum("age")).show()
+--------+
|sum(age)|
+--------+
| 6|
+--------+