Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Funkcja kolekcji: łączy wiele kolumn wejściowych ze sobą w jedną kolumnę. Funkcja działa z ciągami, liczbowymi, binarnymi i zgodnymi kolumnami tablicy. Obsługuje program Spark Connect.
Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz concat funkcja.
Składnia
from pyspark.databricks.sql import functions as dbf
dbf.concat(*cols)
Parametry
| Parameter | Typ | Description |
|---|---|---|
cols |
pyspark.sql.Column lub str |
Kolumna docelowa lub kolumny do pracy. |
Zwraca
pyspark.sql.Column: łączenie wartości. Typ kolumn Column wejściowych zależy od typu kolumn wejściowych.
Przykłady
Przykład 1. Łączenie kolumn ciągów
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd','123')], ['s', 'd'])
df.select(dbf.concat(df.s, df.d)).show()
+------------+
|concat(s, d)|
+------------+
| abcd123|
+------------+
Przykład 2. Łączenie kolumn tablicy
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([1, 2], [3, 4], [5]), ([1, 2], None, [3])], ['a', 'b', 'c'])
df.select(dbf.concat(df.a, df.b, df.c)).show()
+---------------+
|concat(a, b, c)|
+---------------+
|[1, 2, 3, 4, 5]|
| NULL|
+---------------+