Bagikan melalui


Fungsi

Berlaku untuk: centang ditandai ya Databricks Runtime

Spark SQL menyediakan dua fitur fungsi untuk memenuhi berbagai kebutuhan: fungsi bawaan dan fungsi yang ditentukan pengguna (UDF).

Untuk mempelajari tentang resolusi fungsi dan pemanggilan fungsi, lihat: Pemanggilan fungsi.

Fungsi bawaan

Artikel ini menyajikan penggunaan dan deskripsi kategori fungsi bawaan yang sering digunakan untuk agregasi, array dan peta, tanggal dan stempel waktu, dan data JSON.

Fungsi yang ditentukan pengguna SQL dan Python

Fungsi yang ditentukan pengguna (UDF) SQL dan Python adalah fungsi yang dapat Anda tentukan sendiri yang dapat mengembalikan nilai skalar atau tataan hasil.

Lihat CREATE FUNCTION (SQL, Python) untuk informasi selengkapnya.

Fungsi eksternal yang ditentukan pengguna

UDF memungkinkan Anda untuk menentukan fungsi Anda sendiri ketika fungsi bawaan sistem tidak cukup untuk melakukan tugas yang diinginkan. Untuk menggunakan UDF, pertama-tama Anda menentukan fungsi, lalu mendaftarkan fungsi dengan Spark, dan akhirnya memanggil fungsi terdaftar. UDF dapat bertindak pada satu baris atau bertindak pada beberapa baris sekaligus. Spark SQL juga mendukung integrasi implementasi Apache Hive yang ada dari UDF, fungsi agregat yang ditentukan pengguna (UDAF), dan fungsi tabel yang ditentukan pengguna (UDTF).