Funktioner

Gäller för:check markerad ja Databricks Runtime

Spark SQL tillhandahåller två funktionsfunktioner som uppfyller en mängd olika behov: inbyggda funktioner och användardefinierade funktioner (UDF: er).

Mer information om funktionsupplösning och funktionsanrop finns i: Funktionsanrop.

Inbyggda funktioner

Den här artikeln beskriver användning och beskrivningar av kategorier av ofta använda inbyggda funktioner för aggregering, matriser och kartor, datum och tidsstämplar och JSON-data.

Användardefinierade sql- och Python-funktioner

Användardefinierade SQL- och Python-funktioner (UDF: er) är funktioner som du kan definiera själv som kan returnera skalära värden eller resultatuppsättningar.

Mer information finns i CREATE FUNCTION (SQL, Python).

Externa användardefinierade funktioner

Med UDF:er kan du definiera dina egna funktioner när systemets inbyggda funktioner inte räcker för att utföra den önskade uppgiften. Om du vill använda UDF:er definierar du först funktionen, sedan registrerar du funktionen med Spark och anropar slutligen den registrerade funktionen. En UDF kan agera på en enda rad eller agera på flera rader samtidigt. Spark SQL stöder också integrering av befintliga Hive-implementeringar av UDF:er, användardefinierade mängdfunktioner (UDAF) och användardefinierade tabellfunktioner (UDTF).