Поделиться через


substring_index

Возвращает подстроку из строки str перед подсчетом вхождения разделителя делима. Если счетчик положительный, возвращается все левое значение окончательного разделителя (подсчет от левого). Если счетчик отрицательный, возвращается каждый справа от окончательного разделителя (подсчет от правого). substring_index выполняет сопоставление с учетом регистра при поиске делима.

Для соответствующей функции Databricks SQL смотрите функцию substring_index.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.substring_index(str=<str>, delim=<delim>, count=<count>)

Параметры

Параметр Тип Description
str pyspark.sql.Column или str Целевой столбец для работы.
delim literal string разделитель значений.
count int число вхождений.

Возвраты

pyspark.sql.Column: подстрока заданного значения.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()