ユーザー定義関数を呼び出します。
構文
import pyspark.sql.functions as sf
sf.call_udf(udfName=<udfName>, *cols)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
udfName |
str |
ユーザー定義関数 (UDF) の名前。 |
cols |
pyspark.sql.Column または str |
UDF で使用する列名または列。 |
返品ポリシー
pyspark.sql.Column: 実行された udf の結果。
例示
例 1: 整数 UDF でcall_udfを使用する。
from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("intX2", lambda i: i * 2, IntegerType())
df.select(call_udf("intX2", "id")).show()
+---------+
|intX2(id)|
+---------+
| 2|
| 4|
| 6|
+---------+
例 2: 文字列 UDF でcall_udfを使用する。
from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("strX2", lambda s: s * 2, StringType())
df.select(call_udf("strX2", col("name"))).show()
+-----------+
|strX2(name)|
+-----------+
| aa|
| bb|
| cc|
+-----------+