Partager via


FonctionDéfinieParL'Utilisateur

Fonction définie par l’utilisateur dans Python.

Le constructeur de cette classe n’est pas censé être appelé directement. Utilisez ou pyspark.sql.functions.pandas_udf créez pyspark.sql.functions.udf une instance.

Syntaxe

from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

my_udf = udf(lambda x: x.upper(), StringType())

Propriétés

Propriété Description
returnType Type de retour de la fonction définie par l’utilisateur en tant que DataType.

Méthodes

Méthode Description
asNondeterministic() Met à jour UserDefinedFunction en non déterministe.

Exemples

from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
|      ALICE|
|        BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType

random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()