sortWithinPartitions

Vrátí nový datový rámec s každým oddílem seřazeným podle zadaných sloupců.

Syntaxe

sortWithinPartitions(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parametry

Parameter Typ Description
cols int, str, list nebo Sloupec, volitelné list of Column or column names ordinals to sort by.
ascending bool nebo list, volitelné, výchozí hodnota True logická hodnota nebo seznam logických hodnot. Seřaďte vzestupně a sestupně. Zadejte seznam pro více pořadí řazení. Je-li zadán seznam, délka seznamu musí být rovna colsdélce .

Návraty

DataFrame: Datový rámec seřazený podle oddílů.

Poznámky

Pořadový řádek sloupce začíná od 1, který se liší od 0 .__getitem__ Pokud je pořadový řádek sloupce záporný, znamená to, že se seřadí sestupně.

Příklady

from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.sortWithinPartitions("age", ascending=False)
# DataFrame[age: bigint, name: string]

df.coalesce(1).sortWithinPartitions(1).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.coalesce(1).sortWithinPartitions(-1).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+