array_join

Retourneert een tekenreekskolom door de elementen van de invoermatrixkolom samen te voegen met behulp van het scheidingsteken. Null-waarden in de matrix kunnen worden vervangen door een opgegeven tekenreeks via het argument null_replacement. Als null_replacement niet is ingesteld, worden null-waarden genegeerd.

Syntaxis

from pyspark.sql import functions as sf

sf.array_join(col, delimiter, null_replacement=None)

Parameterwaarden

Kenmerk	Typologie	Description
`col`	`pyspark.sql.Column` of str	De invoerkolom met de matrices die moeten worden samengevoegd.
`delimiter`	Str	De tekenreeks die moet worden gebruikt als scheidingsteken bij het samenvoegen van de matrixelementen.
`null_replacement`	str, optioneel	De tekenreeks die null-waarden in de matrix vervangt. Als deze niet is ingesteld, worden null-waarden genegeerd.

Retouren

pyspark.sql.Column: Een nieuwe kolom van het tekenreekstype, waarbij elke waarde het resultaat is van het samenvoegen van de bijbehorende matrix uit de invoerkolom.

Voorbeelden

Voorbeeld 1: Basisgebruik van array_join functie.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", "b", "c"],), (["a", "b"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()

+-------------------+
|array_join(data, ,)|
+-------------------+
|              a,b,c|
|                a,b|
+-------------------+

Voorbeeld 2: Het gebruik van array_join functie met null_replacement argument.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",", "NULL")).show()

+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
|                 a,NULL,c|
+-------------------------+

Voorbeeld 3: Het gebruik van array_join functie zonder null_replacement argument.

from pyspark.sql import functions as sf
df = spark.createDataFrame([(["a", None, "c"],)], ['data'])
df.select(sf.array_join(df.data, ",")).show()

+-------------------+
|array_join(data, ,)|
+-------------------+
|                a,c|
+-------------------+

Voorbeeld 4: Het gebruik van array_join functie met een matrix die null is.

from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([(None,)], schema)
df.select(sf.array_join(df.data, ",")).show()

+-------------------+
|array_join(data, ,)|
+-------------------+
|               NULL|
+-------------------+

Voorbeeld 5: Het gebruik van array_join functie met een matrix die alleen null-waarden bevat.

from pyspark.sql import functions as sf
from pyspark.sql.types import StructType, StructField, ArrayType, StringType
schema = StructType([StructField("data", ArrayType(StringType()), True)])
df = spark.createDataFrame([([None, None],)], schema)
df.select(sf.array_join(df.data, ",", "NULL")).show()

+-------------------------+
|array_join(data, ,, NULL)|
+-------------------------+
|                NULL,NULL|
+-------------------------+

Feedback

Is deze pagina nuttig?

Last updated on 2026-02-01