Funktioner
Gäller för: Databricks Runtime
Spark SQL tillhandahåller två funktionsfunktioner som uppfyller en mängd olika behov: inbyggda funktioner och användardefinierade funktioner (UDF: er).
Mer information om funktionsupplösning och funktionsanrop finns i: Funktionsanrop.
Inbyggda funktioner
Den här artikeln beskriver användning och beskrivningar av kategorier av ofta använda inbyggda funktioner för aggregering, matriser och kartor, datum och tidsstämplar och JSON-data.
Användardefinierade sql- och Python-funktioner
Användardefinierade SQL- och Python-funktioner (UDF: er) är funktioner som du kan definiera själv som kan returnera skalära värden eller resultatuppsättningar.
Mer information finns i CREATE FUNCTION (SQL, Python).
Externa användardefinierade funktioner
Med UDF:er kan du definiera dina egna funktioner när systemets inbyggda funktioner inte räcker för att utföra den önskade uppgiften. Om du vill använda UDF:er definierar du först funktionen, sedan registrerar du funktionen med Spark och anropar slutligen den registrerade funktionen. En UDF kan agera på en enda rad eller agera på flera rader samtidigt. Spark SQL stöder också integrering av befintliga Hive-implementeringar av UDF:er, användardefinierade mängdfunktioner (UDAF) och användardefinierade tabellfunktioner (UDTF).