Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Her bölümü belirtilen sütunlara göre sıralanmış yeni bir DataFrame döndürür.
Sözdizimi
sortWithinPartitions(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
cols |
int, str, list veya Column, isteğe bağlı | sıralanacak Sütun veya sütun adları ya da sütun sıraları listesi. |
ascending |
bool veya list, isteğe bağlı, varsayılan True | boole veya boole listesi. Artan ve azalan düzende sıralayın. Birden çok sıralama düzeni için liste belirtin. Liste belirtilirse, listenin uzunluğu uzunluğuna colseşit olmalıdır. |
İadeler
DataFrame: Bölümlere göre sıralanmış DataFrame.
Notlar
Sütun sıralı 1'den başlar ve bu, 0 tabanlı __getitem__'dan farklıdır. Sütun sıra düzeni negatifse azalan sıralama anlamına gelir.
Örnekler
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.sortWithinPartitions("age", ascending=False)
# DataFrame[age: bigint, name: string]
df.coalesce(1).sortWithinPartitions(1).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+
df.coalesce(1).sortWithinPartitions(-1).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 5| Bob|
# | 2|Alice|
# +---+-----+