Compartir a través de


agrupación

Función de agregado: indica si se agrega o no una columna especificada en una GROUP BY lista, devuelve 1 para agregados o 0 para no agregados en el conjunto de resultados.

Syntax

from pyspark.sql import functions as sf

sf.grouping(col)

Parámetros

Parámetro Tipo Description
col pyspark.sql.Column o str Columna para comprobar si se agrega.

Devoluciones

pyspark.sql.Column: devuelve 1 para agregados o 0 para no agregados en el conjunto de resultados.

Examples

Ejemplo 1: Comprobación del estado de agrupación en la operación de cubo

from pyspark.sql import functions as sf
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], ("name", "age"))
df.cube("name").agg(sf.grouping("name"), sf.sum("age")).orderBy("name").show()
+-----+--------------+--------+
| name|grouping(name)|sum(age)|
+-----+--------------+--------+
| NULL|             1|       7|
|Alice|             0|       2|
|  Bob|             0|       5|
+-----+--------------+--------+