Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Función definida por el usuario en Python.
No se supone que el constructor de esta clase se llame directamente. Use pyspark.sql.functions.udf o pyspark.sql.functions.pandas_udf para crear una instancia.
Sintaxis
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Propiedades
| Propiedad | Descripción |
|---|---|
returnType |
Tipo de valor devuelto de la función definida por el usuario como dataType. |
Methods
| Método | Descripción |
|---|---|
asNondeterministic() |
Actualiza UserDefinedFunction a no determinista. |
Ejemplos
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()