정의된 순서를 사용하여 a WindowSpec 를 만듭니다.
문법
Window.orderBy(*cols)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
cols |
str, Column 또는 list | 열 또는 식의 이름입니다. |
Returns
WindowSpec
예제
from pyspark.sql import Window, functions as sf
df = spark.createDataFrame(
[(1, "a"), (1, "a"), (2, "a"), (1, "b"), (2, "b"), (3, "b")], ["id", "category"])
# Show row number ordered by category in each id partition.
window = Window.partitionBy("id").orderBy("category")
df.withColumn("row_number", sf.row_number().over(window)).show()
# +---+--------+----------+
# | id|category|row_number|
# +---+--------+----------+
# | 1| a| 1|
# | 1| a| 2|
# | 1| b| 3|
# | 2| a| 1|
# | 2| b| 2|
# | 3| b| 1|
# +---+--------+----------+