część

Zwraca nową kolumnę tablicy, wycinając ją z indeksu początkowego na określoną długość. Indeksy zaczynają się od 1 i mogą być ujemne, aby indeksować od końca tablicy. Długość określa liczbę elementów w wynikowej tablicy.

Składnia

from pyspark.sql import functions as sf

sf.slice(x, start, length)

Parametry

Parameter	Typ	Description
`x`	`pyspark.sql.Column` lub str	Wycinek nazwy kolumny lub kolumny wejściowej.
`start`	`pyspark.sql.Column`, str lub int	Indeks początkowy dla operacji fragmentowania. Jeśli wartość ujemna, rozpoczyna indeks od końca tablicy.
`length`	`pyspark.sql.Column`, str lub int	Długość wycinka reprezentująca liczbę elementów w wynikowej tablicy.

Zwraca

pyspark.sql.Column: nowy obiekt Kolumna typu Tablica, gdzie każda wartość jest fragmentem odpowiedniej listy z kolumny wejściowej.

Przykłady

Przykład 1. Podstawowe użycie funkcji slice.

from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3],), ([4, 5],)], ['x'])
df.select(sf.slice(df.x, 2, 2)).show()

+--------------+
|slice(x, 2, 2)|
+--------------+
|        [2, 3]|
|           [5]|
+--------------+

Przykład 2. Fragmentowanie z ujemnym indeksem początkowym.

from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3],), ([4, 5],)], ['x'])
df.select(sf.slice(df.x, -1, 1)).show()

+---------------+
|slice(x, -1, 1)|
+---------------+
|            [3]|
|            [5]|
+---------------+

Przykład 3. Funkcja Slice z danymi wejściowymi kolumn dla początku i długości.

from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3], 2, 2), ([4, 5], 1, 3)], ['x', 'start', 'length'])
df.select(sf.slice(df.x, df.start, df.length)).show()

+-----------------------+
|slice(x, start, length)|
+-----------------------+
|                 [2, 3]|
|                 [4, 5]|
+-----------------------+

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2026-02-01