Funzioni

Si applica a:check contrassegnato sì Databricks Runtime

Spark SQL offre due funzionalità di funzione per soddisfare un'ampia gamma di esigenze: funzioni predefinite e funzioni definite dall'utente.

Per informazioni sulla risoluzione delle funzioni e sulla chiamata alla funzione, vedere: Chiamata alla funzione.

Funzioni predefinite

Questo articolo presenta l'utilizzo e le descrizioni delle categorie di funzioni predefinite usate di frequente per aggregazioni, matrici e mappe, date e timestamp e dati JSON.

Funzioni definite dall'utente sql e Python

Le funzioni definite dall'utente e SQL e Python sono funzioni che è possibile definire autonomamente che possono restituire valori scalari o set di risultati.

Per altre informazioni, vedere CREATE FUNCTION (SQL, Python).

Funzioni definite dall'utente esterne

Le funzioni definite dall'utente consentono di definire le proprie funzioni quando le funzioni predefinite del sistema non sono sufficienti per eseguire l'attività desiderata. Per usare le funzioni definite dall'utente, è prima possibile definire la funzione, quindi registrare la funzione con Spark e infine chiamare la funzione registrata. Una funzione UDF può agire su una singola riga o agire su più righe contemporaneamente. Spark SQL supporta anche l'integrazione di implementazioni hive esistenti di UDFs, funzioni di aggregazione definite dall'utente (UDAF) e funzioni di tabella definite dall'utente (UDTF).