sort

Возвращает новый кадр данных, отсортированный по указанным столбцам.

Синтаксис

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Параметры

Параметр Тип Описание
cols int, str, list или Column, необязательный список имен столбцов или порядковых значений столбцов для сортировки.
ascending bool или list, необязательный, по умолчанию True логический или список логических значений. Сортировка по возрастанию и убыванию. Укажите список для нескольких заказов сортировки. Если указан список, длина списка должна быть равна длине colsсписка.

Возвраты

DataFrame: отсортированный кадр данных.

Примечания

Порядковый номер столбца начинается с 1, который отличается от 0.__getitem__ Если порядковый номер столбца отрицательный, это означает сортировку по убыванию.

Примеры

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+