Sdílet prostřednictvím


Functions

Platí pro:označeno zaškrtnutím ano Databricks Runtime

Spark SQL poskytuje dvě funkce pro splnění široké škály potřeb: předdefinované funkce a uživatelem definované funkce (UDF).

Další informace o rozlišení funkce a vyvolání funkce najdete v tématu: Vyvolání funkce.

Integrované funkce

Tento článek představuje použití a popisy kategorií často používaných předdefinovaných funkcí pro agregaci, pole a mapy, kalendářní data a časová razítka a data JSON.

Uživatelem definované funkce SQL a Pythonu

Uživatelem definované funkce SQL a Pythonu jsou funkce, které můžete definovat sami, které můžou vracet skalární hodnoty nebo sady výsledků.

Další informace najdete v CREATE FUNCTION (SQL, Python).

Externí uživatelem definované funkce

Uživatelské definované funkce (UDFs) umožňují vytvořit vlastní funkce, když vestavěné funkce systému nejsou dostatečné pro splnění požadovaného úkolu. Abyste mohli používat UDFs, nejprve definujete funkci, zaregistrujete ji ve Sparku a pak zaregistrovanou funkci zavoláte. Funkce definovaná uživatelem může působit na jednom řádku nebo pracovat s více řádky najednou. Spark SQL také podporuje integraci stávajících implementací UDF Hive, uživatelem definovaných agregačních funkcí (UDAF) a uživatelem definovaných tabulkových funkcí (UDTF).