Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwraca tablicę elementów, dla których predykat znajduje się w danej tablicy. Obsługuje program Spark Connect.
Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz filter funkcja.
Składnia
from pyspark.databricks.sql import functions as dbf
dbf.filter(col=<col>, f=<f>)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column lub str |
Nazwa kolumny lub wyrażenia. |
f |
function |
Funkcja zwracająca wyrażenie logiczne. Może przyjąć jedną z następujących form: Jednoargumentowy (x: Column) -> Column lub Binarny (x: Column, i: Column) -> Column , gdzie drugi argument jest indeksem 0 elementu. |
Zwraca
pyspark.sql.Column: filtrowana tablica elementów, w których dana funkcja jest obliczana na wartość True po przekazaniu jako argumentu.
Przykłady
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[(1, ["2018-09-20", "2019-02-03", "2019-07-01", "2020-06-01"])],
("key", "values")
)
def after_second_quarter(x):
return dbf.month(dbf.to_date(x)) > 6
df.select(
dbf.filter("values", after_second_quarter).alias("after_second_quarter")
).show(truncate=False)
+------------------------+
|after_second_quarter |
+------------------------+
|[2018-09-20, 2019-07-01]|
+------------------------+