подстрока

Подстрока начинается с и имеет длину, если строка имеет тип String или возвращает срез массива байтов, который начинается pos с pos байта и имеет длину lenlen, когда str является двоичным типом.

Позиция не основана на нуле, а на основе 1 индекса.

Для соответствующей функции Databricks SQL смотрите функцию substring.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Параметры

Параметр	Тип	Description
`str`	`pyspark.sql.Column` или `str`	Целевой столбец для работы.
`pos`	`pyspark.sql.Column` или `str` или `int`	начальная позиция в str.
`len`	`pyspark.sql.Column` или `str` или `int`	длина символов.

Возвраты

pyspark.sql.Column: подстрока заданного значения.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-02-01