Compartir a través de


media

Devuelve el promedio de los valores de un grupo. Alias de avg.

Syntax

from pyspark.sql import functions as sf

sf.mean(col)

Parámetros

Parámetro Tipo Description
col pyspark.sql.Column o nombre de columna Columna de destino en la que se va a calcular.

Devoluciones

pyspark.sql.Column: la columna para los resultados calculados.

Examples

Ejemplo 1: Cálculo de la edad media

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, 15), (1990, 2)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     8.5|
+--------+

Ejemplo 2: Cálculo de la edad media con Ninguno

import pyspark.sql.functions as sf
df = spark.createDataFrame([(1982, None), (1990, 2), (2000, 4)], ["birth", "age"])
df.select(sf.mean("age")).show()
+--------+
|avg(age)|
+--------+
|     3.0|
+--------+