Sdílet prostřednictvím


Funkce

Platí pro: zaškrtnutí označeného ano Databricks Runtime

Spark SQL poskytuje dvě funkce pro splnění široké škály potřeb: předdefinované funkce a uživatelem definované funkce (UDF).

Další informace o rozlišení funkce a vyvolání funkce najdete v tématu: Vyvolání funkce.

Integrované funkce

Tento článek představuje použití a popisy kategorií často používaných předdefinovaných funkcí pro agregaci, pole a mapy, kalendářní data a časová razítka a data JSON.

Uživatelem definované funkce SQL a Pythonu

Uživatelem definované funkce SQL a Pythonu jsou funkce, které můžete definovat sami, které můžou vracet skalární hodnoty nebo sady výsledků.

Další informace najdete v tématu CREATE FUNCTION (SQL, Python).

Externí uživatelem definované funkce

Funkce definované uživatelem umožňují definovat vlastní funkce, pokud předdefinované funkce systému nestačí k provedení požadované úlohy. Pokud chcete používat funkce definované uživatelem, nejprve funkci definujete, zaregistrujete ji ve Sparku a nakonec zavoláte zaregistrovanou funkci. Funkce definovaná uživatelem může pracovat na jednom řádku nebo pracovat s více řádky najednou. Spark SQL také podporuje integraci stávajících implementací UDF Hive, uživatelem definovaných agregačních funkcí (UDAF) a uživatelem definovaných tabulkových funkcí (UDTF).