Bagikan melalui


array_join

Mengembalikan kolom string dengan menggabungkan elemen kolom array input menggunakan pemisah. Nilai null dalam array dapat diganti dengan string tertentu melalui argumen null_replacement. Jika null_replacement tidak diatur, nilai null diabaikan.

Syntax

from pyspark.sql import functions as sf

sf.array_join(col, delimiter, null_replacement=None)

Parameter-parameternya

Pengaturan Tipe Description
col pyspark.sql.Column atau str Kolom input yang berisi array yang akan digabungkan.
delimiter str String yang akan digunakan sebagai pemisah saat menggabungkan elemen array.
null_replacement str, opsional String untuk mengganti nilai null dalam array. Jika tidak diatur, nilai null diabaikan.

Pengembalian Barang

pyspark.sql.Column: Kolom baru jenis string, di mana setiap nilai adalah hasil menggabungkan array yang sesuai dari kolom input.

Examples

Contoh 1: Penggunaan dasar fungsi array_join.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],), (["a", "b"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
|              a,b,c|
|                a,b|
+-------------------+

Contoh 2: Penggunaan fungsi array_join dengan argumen null_replacement.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",", "NULL")).show()
+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
|                 a,NULL,c|
+-------------------------+

Contoh 3: Penggunaan fungsi array_join tanpa argumen null_replacement.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
|                a,c|
+-------------------+

Contoh 4: Penggunaan fungsi array_join dengan array yang null.

from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([(None,)], schema)
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
|               NULL|
+-------------------+

Contoh 5: Penggunaan fungsi array_join dengan array yang hanya berisi nilai null.

from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([([None, None],)], schema)
df.select(sf.array_join(df.data, ",", "NULL")).show()
+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
|                NULL,NULL|
+-------------------------+