Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwraca nową kolumnę tablicy, wycinając ją z indeksu początkowego na określoną długość. Indeksy zaczynają się od 1 i mogą być ujemne, aby indeksować od końca tablicy. Długość określa liczbę elementów w wynikowej tablicy.
Składnia
from pyspark.sql import functions as sf
sf.slice(x, start, length)
Parametry
| Parameter | Typ | Description |
|---|---|---|
x |
pyspark.sql.Column lub str |
Wycinek nazwy kolumny lub kolumny wejściowej. |
start |
pyspark.sql.Column, str lub int |
Indeks początkowy dla operacji fragmentowania. Jeśli wartość ujemna, rozpoczyna indeks od końca tablicy. |
length |
pyspark.sql.Column, str lub int |
Długość wycinka reprezentująca liczbę elementów w wynikowej tablicy. |
Zwraca
pyspark.sql.Column: nowy obiekt Kolumna typu Tablica, gdzie każda wartość jest fragmentem odpowiedniej listy z kolumny wejściowej.
Przykłady
Przykład 1. Podstawowe użycie funkcji slice.
from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3],), ([4, 5],)], ['x'])
df.select(sf.slice(df.x, 2, 2)).show()
+--------------+
|slice(x, 2, 2)|
+--------------+
| [2, 3]|
| [5]|
+--------------+
Przykład 2. Fragmentowanie z ujemnym indeksem początkowym.
from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3],), ([4, 5],)], ['x'])
df.select(sf.slice(df.x, -1, 1)).show()
+---------------+
|slice(x, -1, 1)|
+---------------+
| [3]|
| [5]|
+---------------+
Przykład 3. Funkcja Slice z danymi wejściowymi kolumn dla początku i długości.
from pyspark.sql import functions as sf
df = spark.createDataFrame([([1, 2, 3], 2, 2), ([4, 5], 1, 3)], ['x', 'start', 'length'])
df.select(sf.slice(df.x, df.start, df.length)).show()
+-----------------------+
|slice(x, start, length)|
+-----------------------+
| [2, 3]|
| [4, 5]|
+-----------------------+