Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Función definida por el usuario en Python.
No se supone que el constructor de esta clase se llame directamente. Use pyspark.sql.functions.udf o pyspark.sql.functions.pandas_udf para crear una instancia.
Sintaxis
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Propiedades
| Propiedad | Descripción |
|---|---|
returnType |
Tipo de valor devuelto de la función definida por el usuario como dataType. |
Methods
| Método | Descripción |
|---|---|
asNondeterministic() |
Actualiza UserDefinedFunction a no determinista. |
Ejemplos
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()