Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
Een door de gebruiker gedefinieerde functie in Python.
De constructor van deze klasse mag niet rechtstreeks worden aangeroepen. Een pyspark.sql.functions.udf exemplaar gebruiken of pyspark.sql.functions.pandas_udf maken.
Syntaxis
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Eigenschappen
| Vastgoed | Beschrijving |
|---|---|
returnType |
Het retourtype van de door de gebruiker gedefinieerde functie als een DataType. |
Methods
| Methode | Beschrijving |
|---|---|
asNondeterministic() |
Hiermee werkt u userDefinedFunction bij naar niet-deterministisch. |
Examples
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()