Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Wywoływanie funkcji zdefiniowanej przez użytkownika.
Składnia
import pyspark.sql.functions as sf
sf.call_udf(udfName=<udfName>, *cols)
Parametry
| Parameter | Typ | Description |
|---|---|---|
udfName |
str |
Nazwa funkcji zdefiniowanej przez użytkownika (UDF). |
cols |
pyspark.sql.Column lub str |
Nazwy kolumn lub kolumny do użycia w funkcji zdefiniowanej przez użytkownika. |
Zwraca
pyspark.sql.Column: wynik wykonania udf.
Przykłady
Przykład 1. Używanie call_udf z liczbą całkowitą UDF.
from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("intX2", lambda i: i * 2, IntegerType())
df.select(call_udf("intX2", "id")).show()
+---------+
|intX2(id)|
+---------+
| 2|
| 4|
| 6|
+---------+
Przykład 2. Używanie call_udf z ciągiem UDF.
from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("strX2", lambda s: s * 2, StringType())
df.select(call_udf("strX2", col("name"))).show()
+-----------+
|strX2(name)|
+-----------+
| aa|
| bb|
| cc|
+-----------+