Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan kolom string dengan menggabungkan elemen kolom array input menggunakan pemisah. Nilai null dalam array dapat diganti dengan string tertentu melalui argumen null_replacement. Jika null_replacement tidak diatur, nilai null diabaikan.
Syntax
from pyspark.sql import functions as sf
sf.array_join(col, delimiter, null_replacement=None)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col |
pyspark.sql.Column atau str |
Kolom input yang berisi array yang akan digabungkan. |
delimiter |
str | String yang akan digunakan sebagai pemisah saat menggabungkan elemen array. |
null_replacement |
str, opsional | String untuk mengganti nilai null dalam array. Jika tidak diatur, nilai null diabaikan. |
Pengembalian Barang
pyspark.sql.Column: Kolom baru jenis string, di mana setiap nilai adalah hasil menggabungkan array yang sesuai dari kolom input.
Examples
Contoh 1: Penggunaan dasar fungsi array_join.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],), (["a", "b"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
| a,b,c|
| a,b|
+-------------------+
Contoh 2: Penggunaan fungsi array_join dengan argumen null_replacement.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",", "NULL")).show()
+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
| a,NULL,c|
+-------------------------+
Contoh 3: Penggunaan fungsi array_join tanpa argumen null_replacement.
from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
| a,c|
+-------------------+
Contoh 4: Penggunaan fungsi array_join dengan array yang null.
from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([(None,)], schema)
df.select(sf.array_join(df.data, ",")).show()
+-------------------+
|array_join(data, ,)|
+-------------------+
| NULL|
+-------------------+
Contoh 5: Penggunaan fungsi array_join dengan array yang hanya berisi nilai null.
from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([([None, None],)], schema)
df.select(sf.array_join(df.data, ",", "NULL")).show()
+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
| NULL,NULL|
+-------------------------+