시작부터 중지까지 정수 시퀀스를 생성하여 단계별로 증분합니다. 단계가 설정되지 않은 경우 시작이 중지보다 작거나 같으면 함수가 1씩 증가합니다. 그렇지 않으면 1씩 감소합니다.
문법
from pyspark.sql import functions as sf
sf.sequence(start, stop, step=None)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
start |
pyspark.sql.Column 또는 str |
시퀀스의 시작 값(포함)입니다. |
stop |
pyspark.sql.Column 또는 str |
시퀀스의 마지막 값(포함)입니다. |
step |
pyspark.sql.Column 또는 str, 선택 사항 |
시퀀스에서 다음 요소를 가져오기 위해 현재 요소에 추가할 값입니다. 시작이 중지보다 작거나 같으면 기본값은 1이고, 그렇지 않으면 -1입니다. |
Returns
pyspark.sql.Column: 시퀀스 값의 배열을 포함하는 새 열입니다.
예시
예제 1: 기본 단계를 사용하여 시퀀스 생성
import pyspark.sql.functions as sf
df = spark.createDataFrame([(-2, 2)], ['start', 'stop'])
df.select(sf.sequence(df.start, df.stop)).show()
+---------------------+
|sequence(start, stop)|
+---------------------+
| [-2, -1, 0, 1, 2]|
+---------------------+
예제 2: 사용자 지정 단계를 사용하여 시퀀스 생성
import pyspark.sql.functions as sf
df = spark.createDataFrame([(4, -4, -2)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [4, 2, 0, -2, -4]|
+---------------------------+
예제 3: 음수 단계를 사용하여 시퀀스 생성
import pyspark.sql.functions as sf
df = spark.createDataFrame([(5, 1, -1)], ['start', 'stop', 'step'])
df.select(sf.sequence(df.start, df.stop, df.step)).show()
+---------------------------+
|sequence(start, stop, step)|
+---------------------------+
| [5, 4, 3, 2, 1]|
+---------------------------+