潛在客戶

視窗函式：回傳距當前列之後的 offset 數值，以及 default 如果距當前列數少 offset 於此。例如， offset 一個 of one 會回傳視窗分割任一點的下一列。

這相當於SQL中的LEAD函式。

語法

from pyspark.sql import functions as sf

sf.lead(col, offset=1, default=None)

參數

參數	類型	Description
`col`	`pyspark.sql.Column` 或欄位名稱	欄位名稱或表達式名稱。
`offset`	int，可選	要延伸的行數。預設為 1。
`default`	optional	預設值。

退貨

pyspark.sql.Column：根據當前列 offset的值。

範例

範例 1：利用潛在客戶取得下一個價值

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.show()

+---+---+
| c1| c2|
+---+---+
|  a|  1|
|  a|  2|
|  a|  3|
|  b|  8|
|  b|  2|
+---+---+

w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2").over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         2|
|  a|  2|         3|
|  a|  3|      NULL|
|  b|  2|         8|
|  b|  8|      NULL|
+---+---+----------+

範例 2：使用預設值的潛在客戶

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2", 1, 0).over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         2|
|  a|  2|         3|
|  a|  3|         0|
|  b|  2|         8|
|  b|  8|         0|
+---+---+----------+

範例三：使用偏移量為 2 的鉛

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2", 2, -1).over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         3|
|  a|  2|        -1|
|  a|  3|        -1|
|  b|  2|        -1|
|  b|  8|        -1|
+---+---+----------+

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-02-01

共用方式為

潛在客戶

語法

參數

退貨

範例

意見反應

其他資源