Свертки

Создайте многомерный накопительный пакет для текущего кадра данных с помощью указанных столбцов, что позволяет агрегировать их.

Синтаксис

rollup(*cols: "ColumnOrNameOrOrdinal")

Параметры

Параметр Тип Описание
cols list, str, int или Column Столбцы для свертки. Каждый элемент должен быть именем столбца (строкой) или выражением (столбец) или порядковым порядковым номером столбца (int, 1) или списком из них.

Возвраты

GroupedData: свернутые данные на основе указанных столбцов.

Примечания

Порядковый номер столбца начинается с 1, который отличается от 0.__getitem__

Примеры

df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])

df.rollup("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL|    2|
# |Alice|    1|
# |  Bob|    1|
# +-----+-----+

df.rollup("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL|    2|
# |Alice|NULL|    1|
# |Alice|   2|    1|
# |  Bob|NULL|    1|
# |  Bob|   5|    1|
# +-----+----+-----+