Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Olyan elemtömböt ad vissza, amelyhez egy predikátum egy adott tömbben található. Támogatja a Spark Connectet.
A megfelelő Databricks SQL-függvényhez lásd a függvénytfilter.
Szemantika
from pyspark.databricks.sql import functions as dbf
dbf.filter(col=<col>, f=<f>)
Paraméterek
| Paraméter | Típus | Description |
|---|---|---|
col |
pyspark.sql.Column vagy str |
Oszlop vagy kifejezés neve. |
f |
function |
Egy függvény, amely a logikai kifejezést adja vissza. A következő űrlapok egyikét használhatja: Unary (x: Column) -> Column vagy Bináris (x: Column, i: Column) -> Column , ahol a második argumentum az elem 0-alapú indexe. |
Visszatérítések
pyspark.sql.Column: az elemek szűrt tömbje, ahol az adott függvény argumentumként való átadáskor igaz értékre van kiértékelve.
Példák
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[(1, ["2018-09-20", "2019-02-03", "2019-07-01", "2020-06-01"])],
("key", "values")
)
def after_second_quarter(x):
return dbf.month(dbf.to_date(x)) > 6
df.select(
dbf.filter("values", after_second_quarter).alias("after_second_quarter")
).show(truncate=False)
+------------------------+
|after_second_quarter |
+------------------------+
|[2018-09-20, 2019-07-01]|
+------------------------+