Compartir por


call_udf

Llame a una función definida por el usuario.

Syntax

import pyspark.sql.functions as sf

sf.call_udf(udfName=<udfName>, *cols)

Parámetros

Parámetro Tipo Description
udfName str Nombre de la función definida por el usuario (UDF).
cols pyspark.sql.Column o str Nombres de columna o Columnas que se van a usar en la UDF.

Devoluciones

pyspark.sql.Column: resultado de udf ejecutado.

Examples

Ejemplo 1: Uso de call_udf con un UDF entero.

from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("intX2", lambda i: i * 2, IntegerType())
df.select(call_udf("intX2", "id")).show()
+---------+
|intX2(id)|
+---------+
|        2|
|        4|
|        6|
+---------+

Ejemplo 2: Uso de call_udf con una UDF de cadena.

from pyspark.sql.functions import call_udf, col
from pyspark.sql.types import IntegerType, StringType
df = spark.createDataFrame([(1, "a"),(2, "b"), (3, "c")],["id", "name"])
_ = spark.udf.register("strX2", lambda s: s * 2, StringType())
df.select(call_udf("strX2", col("name"))).show()
+-----------+
|strX2(name)|
+-----------+
|         aa|
|         bb|
|         cc|
+-----------+