Funkce
Platí pro: Databricks Runtime
Spark SQL poskytuje dvě funkce pro splnění široké škály potřeb: předdefinované funkce a uživatelem definované funkce (UDF).
Další informace o rozlišení funkce a vyvolání funkce najdete v tématu: Vyvolání funkce.
Integrované funkce
Tento článek představuje použití a popisy kategorií často používaných předdefinovaných funkcí pro agregaci, pole a mapy, kalendářní data a časová razítka a data JSON.
Uživatelem definované funkce SQL a Pythonu
Uživatelem definované funkce SQL a Pythonu jsou funkce, které můžete definovat sami, které můžou vracet skalární hodnoty nebo sady výsledků.
Další informace najdete v tématu CREATE FUNCTION (SQL, Python).
Externí uživatelem definované funkce
Funkce definované uživatelem umožňují definovat vlastní funkce, pokud předdefinované funkce systému nestačí k provedení požadované úlohy. Pokud chcete používat funkce definované uživatelem, nejprve funkci definujete, zaregistrujete ji ve Sparku a nakonec zavoláte zaregistrovanou funkci. Funkce definovaná uživatelem může pracovat na jednom řádku nebo pracovat s více řádky najednou. Spark SQL také podporuje integraci stávajících implementací UDF Hive, uživatelem definovaných agregačních funkcí (UDAF) a uživatelem definovaných tabulkových funkcí (UDTF).