Bagikan melalui


array_repeat

Membuat array yang berisi kolom yang diulang sejumlah kali.

Syntax

from pyspark.sql import functions as sf

sf.array_repeat(col, count)

Parameter-parameternya

Pengaturan Tipe Description
col pyspark.sql.Column atau str Nama kolom atau ekspresi yang mewakili elemen yang akan diulang.
count pyspark.sql.Column, str, atau int Nama kolom, ekspresi, atau bilangan bulat yang mewakili berapa kali untuk mengulangi elemen.

Pengembalian Barang

pyspark.sql.Column: Kolom baru yang berisi array elemen berulang.

Examples

Contoh 1: Penggunaan dengan string

from pyspark.sql import functions as sf
df = spark.createDataFrame([('ab',)], ['data'])
df.select(sf.array_repeat(df.data, 3)).show()
+---------------------+
|array_repeat(data, 3)|
+---------------------+
|         [ab, ab, ab]|
+---------------------+

Contoh 2: Penggunaan dengan bilangan bulat

from pyspark.sql import functions as sf
df = spark.createDataFrame([(3,)], ['data'])
df.select(sf.array_repeat(df.data, 2)).show()
+---------------------+
|array_repeat(data, 2)|
+---------------------+
|               [3, 3]|
+---------------------+

Contoh 3: Penggunaan dengan array

from pyspark.sql import functions as sf
df = spark.createDataFrame([(['apple', 'banana'],)], ['data'])
df.select(sf.array_repeat(df.data, 2)).show(truncate=False)
+----------------------------------+
|array_repeat(data, 2)             |
+----------------------------------+
|[[apple, banana], [apple, banana]]|
+----------------------------------+

Contoh 4: Penggunaan dengan null

from pyspark.sql import functions as sf
from pyspark.sql.types import IntegerType, StructType, StructField
schema = StructType([
  StructField("data", IntegerType(), True)
])
df = spark.createDataFrame([(None, )], schema=schema)
df.select(sf.array_repeat(df.data, 3)).show()
+---------------------+
|array_repeat(data, 3)|
+---------------------+
|   [NULL, NULL, NULL]|
+---------------------+