řadit

Vrátí nový datový rámec seřazený podle zadaných sloupců.

Syntaxe

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parametry

Parameter Typ Description
cols int, str, list nebo Column, optional list of Column or column names ordinals to sort by.
ascending bool nebo list, volitelné, výchozí hodnota True logická hodnota nebo seznam logických hodnot. Seřaďte vzestupně a sestupně. Zadejte seznam pro více pořadí řazení. Je-li zadán seznam, délka seznamu musí být rovna colsdélce .

Návraty

DataFrame: Seřazený datový rámec.

Poznámky

Pořadový řádek sloupce začíná od 1, který se liší od 0 .__getitem__ Pokud je pořadový řádek sloupce záporný, znamená to, že se seřadí sestupně.

Příklady

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+