Udostępnij przez


array_repeat

Tworzy tablicę zawierającą kolumnę powtórzoną określoną liczbę razy.

Składnia

from pyspark.sql import functions as sf

sf.array_repeat(col, count)

Parametry

Parameter Typ Description
col pyspark.sql.Column lub str Nazwa kolumny lub wyrażenia reprezentującego element do powtórzenia.
count pyspark.sql.Column, str lub int Nazwa kolumny, wyrażenia lub liczby całkowitej reprezentującej liczbę powtórzeń elementu.

Zwraca

pyspark.sql.Column: nowa kolumna zawierająca tablicę powtarzających się elementów.

Przykłady

Przykład 1. Użycie z ciągiem

from pyspark.sql import functions as sf
df = spark.createDataFrame([('ab',)], ['data'])
df.select(sf.array_repeat(df.data, 3)).show()
+---------------------+
|array_repeat(data, 3)|
+---------------------+
|         [ab, ab, ab]|
+---------------------+

Przykład 2. Użycie z liczbą całkowitą

from pyspark.sql import functions as sf
df = spark.createDataFrame([(3,)], ['data'])
df.select(sf.array_repeat(df.data, 2)).show()
+---------------------+
|array_repeat(data, 2)|
+---------------------+
|               [3, 3]|
+---------------------+

Przykład 3. Użycie z tablicą

from pyspark.sql import functions as sf
df = spark.createDataFrame([(['apple', 'banana'],)], ['data'])
df.select(sf.array_repeat(df.data, 2)).show(truncate=False)
+----------------------------------+
|array_repeat(data, 2)             |
+----------------------------------+
|[[apple, banana], [apple, banana]]|
+----------------------------------+

Przykład 4. Użycie z wartością null

from pyspark.sql import functions as sf
from pyspark.sql.types import IntegerType, StructType, StructField
schema = StructType([
  StructField("data", IntegerType(), True)
])
df = spark.createDataFrame([(None, )], schema=schema)
df.select(sf.array_repeat(df.data, 3)).show()
+---------------------+
|array_repeat(data, 3)|
+---------------------+
|   [NULL, NULL, NULL]|
+---------------------+