Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Belirtilen sütunları kullanarak geçerli DataFrame için çok boyutlu bir küp oluşturun ve bunlar üzerinde toplamaların gerçekleştirilebilmesini sağlayın.
Sözdizimi
cube(*cols: "ColumnOrName")
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
cols |
list, str, int veya Column | Küp ölçütüne göre sütunlar. Her öğe bir sütun adı (dize) veya ifade (Sütun) ya da sütun sıralı (int, 1 tabanlı) veya bunların listesi olmalıdır. |
İadeler
GroupedData: Belirtilen sütunları temel alan veri küpü.
Notlar
Sütun sıralı 1'den başlar ve bu, 0 tabanlı __getitem__'dan farklıdır.
Örnekler
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])
df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL| 2|
# |Alice| 1|
# | Bob| 1|
# +-----+-----+
df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL| 2|
# | NULL| 2| 1|
# | NULL| 5| 1|
# |Alice|NULL| 1|
# |Alice| 2| 1|
# | Bob|NULL| 1|
# | Bob| 5| 1|
# +-----+----+-----+