Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Fonction définie par l’utilisateur dans Python.
Le constructeur de cette classe n’est pas censé être appelé directement. Utilisez ou pyspark.sql.functions.pandas_udf créez pyspark.sql.functions.udf une instance.
Syntaxe
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Propriétés
| Propriété | Description |
|---|---|
returnType |
Type de retour de la fonction définie par l’utilisateur en tant que DataType. |
Méthodes
| Méthode | Description |
|---|---|
asNondeterministic() |
Met à jour UserDefinedFunction en non déterministe. |
Exemples
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()