Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve el promedio de los valores de un grupo.
Syntax
from pyspark.sql import functions as sf
sf.avg(col)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column o nombre de columna |
Columna de destino en la que se va a calcular. |
Devoluciones
pyspark.sql.Column: la columna para los resultados calculados.
Examples
Ejemplo 1: Cálculo de la edad media
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
| 8.5|
+--------+
Ejemplo 2: Cálculo de la edad media con Ninguno
import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.avg("age")).show()
+--------+
|avg(age)|
+--------+
| 3.0|
+--------+