Kumulativní

Vytvořte vícerozměrnou kumulativní aktualizaci pro aktuální datový rámec pomocí zadaných sloupců, což umožňuje jejich agregaci.

Syntaxe

rollup(*cols: "ColumnOrNameOrOrdinal")

Parametry

Parameter Typ Description
cols list, str, int nebo Column Sloupce, podle kterých se mají shrnovat. Každý prvek by měl být název sloupce (řetězec) nebo výraz (Column) nebo pořadové číslo sloupce (int, 1) nebo jejich seznam.

Návraty

GroupedData: Zahrnutá data na základě zadaných sloupců.

Poznámky

Pořadový řádek sloupce začíná od 1, který se liší od 0 .__getitem__

Příklady

df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])

df.rollup("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL|    2|
# |Alice|    1|
# |  Bob|    1|
# +-----+-----+

df.rollup("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL|    2|
# |Alice|NULL|    1|
# |Alice|   2|    1|
# |  Bob|NULL|    1|
# |  Bob|   5|    1|
# +-----+----+-----+