Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Funkcja kolekcji: zwraca długość tablicy lub mapy przechowywanej w kolumnie.
Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz cardinality funkcja.
Składnia
from pyspark.databricks.sql import functions as dbf
dbf.cardinality(col=<col>)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column lub str |
Kolumna docelowa do obliczenia. |
Zwraca
pyspark.sql.Column: długość tablicy/mapy.
Przykłady
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([1, 2, 3],),([1],),([],)], ['data'])
df.select(dbf.cardinality("data")).show()
+-----------------+
|cardinality(data)|
+-----------------+
| 3|
| 1|
| 0|
+-----------------+