Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan DataFrame baru dengan setiap partisi yang diurutkan menurut kolom yang ditentukan.
Sintaksis
sortWithinPartitions(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
cols |
int, str, list atau Column, opsional | daftar nama Kolom atau kolom atau ordinal kolom untuk diurutkan. |
ascending |
bool atau daftar, opsional, default True | boolean atau daftar boolean. Urutkan naik vs. turun. Tentukan daftar untuk beberapa urutan pengurutan. Jika daftar ditentukan, panjang daftar harus sama dengan panjang cols. |
Pengembalian Barang
DataFrame: DataFrame diurutkan menurut partisi.
Catatan
Ordinal kolom dimulai dari 1, yang berbeda dari berbasis __getitem__0 . Jika ordinal kolom negatif, itu berarti mengurutkan turun.
Examples
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.sortWithinPartitions("age", ascending=False)
# DataFrame[age: bigint, name: string]
df.coalesce(1).sortWithinPartitions(1).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 2|Alice|
# | 5| Bob|
# +---+-----+
df.coalesce(1).sortWithinPartitions(-1).show()
# +---+-----+
# |age| name|
# +---+-----+
# | 5| Bob|
# | 2|Alice|
# +---+-----+