潜在客户

Window 函数：返回当前 offset 行之后的行的值，如果 default 当前行之后的行小于 offset 行。例如，其中一个 offset 将返回窗口分区中任意给定点的下一行。

这相当于 SQL 中的 LEAD 函数。

Syntax

from pyspark.sql import functions as sf

sf.lead(col, offset=1, default=None)

参数

参数	类型	Description
`col`	`pyspark.sql.Column` 或列名	列或表达式的名称。
`offset`	int，可选	要扩展的行数。默认值为 1。
`default`	optional	默认值。

退货

pyspark.sql.Column：基于 offset当前行后的值。

例子

示例 1：使用潜在顾客获取下一个值

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
df.show()

+---+---+
| c1| c2|
+---+---+
|  a|  1|
|  a|  2|
|  a|  3|
|  b|  8|
|  b|  2|
+---+---+

w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2").over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         2|
|  a|  2|         3|
|  a|  3|      NULL|
|  b|  2|         8|
|  b|  8|      NULL|
+---+---+----------+

示例 2：将潜在顾客与默认值结合使用

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2", 1, 0).over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         2|
|  a|  2|         3|
|  a|  3|         0|
|  b|  2|         8|
|  b|  8|         0|
+---+---+----------+

示例 3：使用偏移量为 2 的潜在客户

from pyspark.sql import functions as sf
from pyspark.sql import Window
df = spark.createDataFrame(
    [("a", 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["c1", "c2"])
w = Window.partitionBy("c1").orderBy("c2")
df.withColumn("next_value", sf.lead("c2", 2, -1).over(w)).show()

+---+---+----------+
| c1| c2|next_value|
+---+---+----------+
|  a|  1|         3|
|  a|  2|        -1|
|  a|  3|        -1|
|  b|  2|        -1|
|  b|  8|        -1|
+---+---+----------+

反馈

此页面是否有帮助？

Last updated on 2026-02-01

通过

潜在客户

Syntax

参数

退货

例子

反馈

其他资源