Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan array elemen yang predikatnya ditahan dalam array tertentu. Mendukung Spark Connect.
Untuk fungsi Databricks SQL yang sesuai, lihat filter fungsi.
Syntax
from pyspark.sql import functions as dbf
dbf.filter(col=<col>, f=<f>)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col |
pyspark.sql.Column atau str |
Nama kolom atau ekspresi. |
f |
function |
Fungsi yang mengembalikan ekspresi Boolean. Dapat mengambil salah satu formulir berikut: Unary atau Binary (x: Column) -> Column(x: Column, i: Column) -> Column di mana argumen kedua adalah indeks berbasis 0 dari elemen. |
Pengembalian Barang
pyspark.sql.Column: array elemen yang difilter tempat fungsi yang diberikan dievaluasi ke True saat diteruskan sebagai argumen.
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame(
[(1, ["2018-09-20", "2019-02-03", "2019-07-01", "2020-06-01"])],
("key", "values")
)
def after_second_quarter(x):
return dbf.month(dbf.to_date(x)) > 6
df.select(
dbf.filter("values", after_second_quarter).alias("after_second_quarter")
).show(truncate=False)
+------------------------+
|after_second_quarter |
+------------------------+
|[2018-09-20, 2019-07-01]|
+------------------------+