Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
En användardefinierad funktion i Python.
Konstruktorn för den här klassen ska inte anropas direkt. Använd pyspark.sql.functions.udf eller pyspark.sql.functions.pandas_udf för att skapa en instans.
Syntax
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
my_udf = udf(lambda x: x.upper(), StringType())
Egenskaper
| Fastighet | Beskrivning |
|---|---|
returnType |
Returtypen för den användardefinierade funktionen som en DataType. |
Methods
| Metod | Beskrivning |
|---|---|
asNondeterministic() |
Uppdaterar UserDefinedFunction till nondeterministisk. |
Exempel
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType
upper_udf = udf(lambda x: x.upper(), StringType())
df = spark.createDataFrame([("alice",), ("bob",)], ["name"])
df.select(upper_udf("name")).show()
+-----------+
|<lambda>(name)|
+-----------+
| ALICE|
| BOB|
+-----------+
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
random_udf = udf(lambda: random.randint(0, 100), IntegerType()).asNondeterministic()
random_udf.returnType
IntegerType()