Поделиться через


size

Функция сбора: возвращает длину массива или карты, хранящейся в столбце. Поддерживает Spark Connect.

Для соответствующей функции Databricks SQL смотрите функцию size.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.size(col=<col>)

Параметры

Параметр Тип Description
col pyspark.sql.Column или str Имя столбца или выражения.

Возвраты

pyspark.sql.Column: длина массива или карты.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([1, 2, 3],),([1],),([],)], ['data'])
df.select(dbf.size(df.data)).collect()
[Row(size(data)=3), Row(size(data)=1), Row(size(data)=0)]