kubus

Buat kubus multi-dimensi untuk DataFrame saat ini menggunakan kolom yang ditentukan, yang memungkinkan agregasi dilakukan padanya.

Sintaksis

cube(*cols: "ColumnOrName")

Parameter-parameternya

Parameter Tipe Deskripsi
cols daftar, str, int, atau Kolom Kolom untuk dikubus dengan. Setiap elemen harus berupa nama kolom (string) atau ekspresi (Kolom) atau ordinal kolom (int, berbasis 1) atau daftarnya.

Pengembalian Barang

GroupedData: Kubus data berdasarkan kolom yang ditentukan.

Catatan

Ordinal kolom dimulai dari 1, yang berbeda dari berbasis __getitem__0 .

Examples

df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])

df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL|    2|
# |Alice|    1|
# |  Bob|    1|
# +-----+-----+

df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL|    2|
# | NULL|   2|    1|
# | NULL|   5|    1|
# |Alice|NULL|    1|
# |Alice|   2|    1|
# |  Bob|NULL|    1|
# |  Bob|   5|    1|
# +-----+----+-----+