Nota
L'accés a aquesta pàgina requereix autorització. Podeu provar d'iniciar la sessió o de canviar els directoris.
L'accés a aquesta pàgina requereix autorització. Podeu provar de canviar els directoris.
Función definida por el usuario en Python.
No se supone que el constructor de esta clase se llame directamente. Use pyspark.sql.functions.udf o pyspark.sql.functions.pandas_udf para crear una instancia.
Sintaxis
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Propiedades
| Propiedad | Descripción |
|---|---|
returnType |
Tipo de valor devuelto de la función definida por el usuario como dataType. |
Methods
| Método | Descripción |
|---|---|
asNondeterministic() |
Actualiza UserDefinedFunction a no determinista. |
Ejemplos
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()