Share via


UDFRegistration

Wrapper voor door de gebruiker gedefinieerde functieregistratie. Dit exemplaar kan worden geopend door spark.udf.

Syntaxis

# Access through SparkSession
spark.udf

Eigenschappen

Vastgoed Beschrijving
logs Retourneert een UDFLogs-exemplaar voor UDF-logboekregistratie. Deze functie is experimenteel en instabiel.

Methods

Methode Beschrijving
register(name, f, returnType) Registreert een Python-functie (inclusief lambda-functies) of een door de gebruiker gedefinieerde functie als een SQL-functie. Ondersteunt Spark Connect.
registerJavaFunction(name, javaClassName, returnType) Registreert een door de gebruiker gedefinieerde Java-functie als een SQL-functie. Wanneer returnType dit niet is opgegeven, wordt deze afgeleid via reflectie. Ondersteunt Spark Connect.
registerJavaUDAF(name, javaClassName) Registreert een door de gebruiker gedefinieerde statistische Java-functie als een SQL-functie. Ondersteunt Spark Connect.

Examples

strlen = spark.udf.register("stringLengthString", lambda x: len(x))
spark.sql("SELECT stringLengthString('test')").collect()
[Row(stringLengthString(test)='4')]
from pyspark.sql.types import IntegerType
from pyspark.sql.functions import udf

slen = udf(lambda s: len(s), IntegerType())
_ = spark.udf.register("slen", slen)
spark.sql("SELECT slen('test')").collect()
[Row(slen(test)=4)]
import pandas as pd
from pyspark.sql.functions import pandas_udf

@pandas_udf("integer")
def add_one(s: pd.Series) -> pd.Series:
    return s + 1

_ = spark.udf.register("add_one", add_one)
spark.sql("SELECT add_one(id) FROM range(3)").collect()
[Row(add_one(id)=1), Row(add_one(id)=2), Row(add_one(id)=3)]