Utilità UDF (User Data Function) di NotebookUtils per Fabric

Il notebookutils.udf modulo fornisce utilità per l'integrazione del codice del notebook con elementi UDF (User Data Function). È possibile accedere alle funzioni da un elemento UDF all'interno della stessa area di lavoro o in aree di lavoro diverse e quindi richiamare tali funzioni in base alle esigenze. Gli elementi UDF promuovono la riutilizzabilità del codice, la manutenzione centralizzata e la collaborazione tra team.

Usare le utilità UDF per:

Recupero delle funzioni – Accesso alle funzioni dagli elementi di una funzione definita dall'utente per nome.
Accesso tra aree di lavoro – Usa le funzioni degli elementi UDF in altre aree di lavoro.
Individuazione delle funzioni: controllare le funzioni disponibili e le relative firme.
Invocazione flessibile: invocare le funzioni con parametri appropriati del linguaggio.

Annotazioni

Per recuperare le funzioni, è necessario l'accesso in lettura a un elemento della funzione definita dall'utente nell'area di lavoro di destinazione. Le eccezioni dalle funzioni UDF vengono propagate al notebook chiamante.

Nella tabella seguente sono elencati i metodi UDF:

metodo	Firma	Descrizione
`getFunctions`	`getFunctions(udf: String, workspaceId: String = ""): UDF`	Recupera tutte le funzioni da un elemento UDF in base all'ID o al nome dell'artefatto. Restituisce un oggetto con attributi di funzione chiamabili.

L'oggetto restituito espone le proprietà seguenti:

Proprietà	Tipo	Descrizione
`functionDetails`	Elenco	Elenco di dizionari di metadati della funzione. Ogni dizionario include: `Name` (nome della funzione), `Description` (descrizione della funzione), `Parameters` (elenco di definizioni di parametri), `FunctionReturnType` (tipo restituito) e `DataSourceConnections` (connessioni all'origine dati usate).
`itemDetails`	Dizionario	Dizionario dei metadati degli elementi UDF con chiavi: `Id` (ID artefatto), `Name` (nome elemento), `WorkspaceId` (ID area di lavoro) e `CapacityId` (ID capacità).
`<functionName>`	Callable	Ogni funzione nell'elemento UDF diventa un metodo chiamabile sull'oggetto restituito. Usare `myFunctions.functionName(...)` per richiamare.

Suggerimento

Recuperare le funzioni UDF una sola volta e memorizzare nella cache l'oggetto wrapper. Evitare di chiamare getFunctions() ripetutamente in un ciclo: memorizzare nella cache il risultato per ridurre al minimo l'overhead.

Recuperare funzioni da una UDF

Usare notebookutils.udf.getFunctions() per ottenere tutte le funzioni da un elemento UDF. Facoltativamente, è possibile specificare un ID area di lavoro per l'accesso tra aree di lavoro.

# Get functions from a UDF item in the current workspace
myFunctions = notebookutils.udf.getFunctions('UDFItemName')

# Get functions from a UDF item in another workspace
myFunctions = notebookutils.udf.getFunctions('UDFItemName', 'workspaceId')

val myFunctions = notebookutils.udf.getFunctions("UDFItemName")
val sharedFunctions = notebookutils.udf.getFunctions("UDFItemName", "workspaceId")

# Get functions from a UDF item in the current workspace
myFunctions <- notebookutils.udf.getFunctions("UDFItemName")

# Get functions from a UDF item in another workspace
myFunctions <- notebookutils.udf.getFunctions("UDFItemName", "workspaceId")

Richiamare una funzione

Dopo aver recuperato le funzioni da un elemento UDF, chiamarle per nome. Python supporta parametri posizionali e denominati. Gli esempi scala e R usano parametri posizionali.

# Positional parameters
myFunctions.functionName('value1', 'value2')

# Named parameters (recommended for clarity)
myFunctions.functionName(parameter1='value1', parameter2='value2')

val res = myFunctions.functionName("value1", "value2")

result <- myFunctions$functionName("value1", "value2")

Valori dei parametri predefiniti

Le funzioni dati utente di Fabric supportano valori di argomento predefiniti. Quando si richiamano le funzioni recuperate tramite notebookutils.udf.getFunctions, è possibile omettere qualsiasi parametro con un valore predefinito definito. Il runtime usa automaticamente l'impostazione predefinita. È anche possibile specificare argomenti denominati per eseguire l'override di impostazioni predefinite specifiche, lasciando le altre ai valori predefiniti.

# Assume the UDF item defines a function like:
# def score_customer(customerId: str, startDate: datetime = "2025-01-01T00:00:00Z", isActive: bool = True, maxRecords: int = 100) -> dict
# The datetime defaults are specified as strings in the signature; the runtime parses them to datetime at invocation time.

# 1. Call without optional parameters — defaults are used for startDate, isActive, and maxRecords
result = myFunctions.scoreCustomer(customerId='C001')

# 2. Override one default via a named argument, keep the others at their defaults
result = myFunctions.scoreCustomer(customerId='C001', maxRecords=50)

# 3. Pass a date/time in ISO 8601 format for reliable parsing
result = myFunctions.scoreCustomer(customerId='C001', startDate='2025-12-31T23:59:59Z')

// All required parameters must be supplied; optional (default) parameters can be omitted.
// Scala does not support named arguments when calling UDF functions through notebookutils.
val result = myFunctions.scoreCustomer("C001")

# All required parameters must be supplied; optional (default) parameters can be omitted.
result <- myFunctions$scoreCustomer("C001")

Tipi di input predefiniti supportati

I tipi seguenti sono supportati come valori di parametro predefiniti:

Tipo predefinito	Notes
Stringa	Qualsiasi stringa serializzabile JSON.
Stringa Data e ora	Specificare come stringa nella firma della funzione. Il runtime lo interpreta in `datetime` al momento dell'invocazione. Usare un formato coerente, ad esempio ISO 8601 , ad esempio `2025-12-31T23:59:59Z`.
Booleano	`True` o `False`.
Integer	Qualsiasi valore intero.
Galleggiare	Qualsiasi valore a virgola mobile.
Elenco	Deve essere serializzabile in JSON; si consiglia di preferire `None` nella firma e di assegnare all'interno della funzione per evitare le trappole dei valori predefiniti mutabili.
Dizionario	Deve essere serializzabile in JSON; preferisce `None` nella firma e assegnare all'interno della funzione.
pandas DataFrame	Fornito come oggetto JSON convertito dall'SDK in un tipo pandas. Richiede `fabric-user-data-functions` la versione 1.0.0 o successiva.
Serie pandas	Fornito come matrice JSON di oggetti che l'SDK converte in un tipo pandas. Richiede `fabric-user-data-functions` la versione 1.0.0 o successiva.

Limitazioni e indicazioni

Le impostazioni predefinite devono essere serializzabili in JSON (i set e le tuple non sono supportati). Per le impostazioni predefinite per l'elenco o il dizionario, usare None nella firma e assegnare il valore predefinito reale all'interno della funzione per evitare valori predefiniti modificabili condivisi. Usare il formato ISO 8601 ,ad esempio 2025-12-31T23:59:59Z, per le impostazioni predefinite datetime. L'uso di pandas DataFrame o Series come impostazione predefinita richiede fabric-user-data-functions la versione 1.0.0 o successiva.

Visualizzare i dettagli

È possibile esaminare programmaticamente i metadati degli elementi UDF e le firme delle funzioni.

Visualizzare i dettagli dell'UDF

display(myFunctions.itemDetails)

display(myFunctions.itemDetails)

myFunctions$itemDetails

Visualizzare i dettagli della funzione

display(myFunctions.functionDetails)

display(myFunctions.functionDetails)

myFunctions$functionDetails

Suggerimento

Controllare sempre functionDetails quando si lavora con un nuovo elemento della funzione definita dall'utente. Ciò consente di verificare le funzioni disponibili e i relativi tipi di parametri previsti prima della chiamata.

Gestione degli errori

Racchiudere le chiamate definite dall'utente nella gestione errori appropriata al linguaggio per gestire funzioni mancanti o tipi di parametri imprevisti. Verificare sempre che esista una funzione nell'elemento UDF prima di chiamarla.

import json

try:
    validators = notebookutils.udf.getFunctions('DataValidators')

    # Check if function exists before calling
    functions_info = json.loads(validators.functionDetails)
    function_names = [f['Name'] for f in functions_info]

    if 'validateSchema' in function_names:
        is_valid = validators.validateSchema(
            schema='sales_schema',
            data_path='Files/data/sales.csv'
        )
        print(f"Schema validation: {'passed' if is_valid else 'failed'}")
    else:
        print("validateSchema function not available in this UDF item")
        print(f"Available functions: {', '.join(function_names)}")

except AttributeError as e:
    print(f"Function not found: {e}")
except TypeError as e:
    print(f"Parameter type mismatch: {e}")
except Exception as e:
    print(f"Error invoking UDF: {e}")

try {
    val validators = notebookutils.udf.getFunctions("DataValidators")
    val isValid = validators.validateSchema("sales_schema", "Files/data/sales.csv")
    println(s"Schema validation: ${if (isValid) "passed" else "failed"}")
} catch {
    case e: Exception => println(s"Error invoking UDF: ${e.getMessage}")
}

validators <- notebookutils.udf.getFunctions("DataValidators")

result <- tryCatch({
    validators$validateSchema("sales_schema", "Files/data/sales.csv")
}, error = function(e) {
    print(paste("Error invoking UDF:", e$message))
    NULL
})

if (!is.null(result)) {
    print(paste("Schema validation:", ifelse(result, "passed", "failed")))
}

Usare funzioni UDF in una pipeline di dati

È possibile comporre funzioni UDF per creare passaggi ETL riutilizzabili.

etl_functions = notebookutils.udf.getFunctions('ETLUtilities')

df = spark.read.csv('Files/raw/sales.csv', header=True)
cleaned_df = etl_functions.removeOutliers(df, columns=['amount'])
enriched_df = etl_functions.addCalculatedColumns(cleaned_df)
validated_df = etl_functions.validateAndFilter(enriched_df)

validated_df.write.mode('overwrite').parquet('Files/processed/sales.parquet')
print("ETL pipeline completed using UDF functions")

Importante

Le invocazioni UDF hanno dei costi aggiuntivi. Se si chiama ripetutamente la stessa funzione con gli stessi parametri, prendere in considerazione la memorizzazione nella cache del risultato. Evitare di chiamare funzioni UDF in cicli stretti, quando possibile.

NotebookUtils per Fabric

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-26