Dela via


Funktioner

Gäller för: markerad ja Databricks Runtime

Spark SQL tillhandahåller två funktionsfunktioner för att uppfylla en mängd olika behov: inbyggda funktioner och användardefinierade funktioner (UDF:er).

Information om funktionsupplösning och funktionsanrop finns i: Funktionsanrop.

Inbyggda funktioner

Den här artikeln beskriver användning och beskrivningar av kategorier av inbyggda funktioner som används ofta för aggregering, matriser och kartor, datum och tidsstämplar samt JSON-data.

Användardefinierade sql- och Python-funktioner

SQL- och Python-användardefinierade funktioner (UDF: er) är funktioner som du kan definiera själv som kan returnera skalära värden eller resultatuppsättningar.

Mer information finns i CREATE FUNCTION (SQL, Python).

Externa användardefinierade funktioner

Med UDF:er kan du definiera dina egna funktioner när systemets inbyggda funktioner inte räcker för att utföra önskad uppgift. Om du vill använda UDF:er definierar du först funktionen, registrerar sedan funktionen med Spark och anropar slutligen den registrerade funktionen. En UDF kan agera på en enskild rad eller agera på flera rader samtidigt. Spark SQL stöder också integrering av befintliga Hive-implementeringar av UDF:er, användardefinierade aggregeringsfunktioner (UDAF) och användardefinierade tabellfunktioner (UDTF).