sortWithinPartitions

Mengembalikan DataFrame baru dengan setiap partisi yang diurutkan menurut kolom yang ditentukan.

Sintaksis

sortWithinPartitions(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parameter-parameternya

Parameter Tipe Deskripsi
cols int, str, list atau Column, opsional daftar nama Kolom atau kolom atau ordinal kolom untuk diurutkan.
ascending bool atau daftar, opsional, default True boolean atau daftar boolean. Urutkan naik vs. turun. Tentukan daftar untuk beberapa urutan pengurutan. Jika daftar ditentukan, panjang daftar harus sama dengan panjang cols.

Pengembalian Barang

DataFrame: DataFrame diurutkan menurut partisi.

Catatan

Ordinal kolom dimulai dari 1, yang berbeda dari berbasis __getitem__0 . Jika ordinal kolom negatif, itu berarti mengurutkan turun.

Examples

from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.sortWithinPartitions("age", ascending=False)
# DataFrame[age: bigint, name: string]

df.coalesce(1).sortWithinPartitions(1).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.coalesce(1).sortWithinPartitions(-1).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+