substring_index

Retorna a substring da cadeia de caracteres str antes de count ocorrências do delimitador delim. Se a contagem for positiva, tudo o que resta do delimitador final (contando da esquerda) será retornado. Se a contagem for negativa, todos à direita do delimitador final (contando da direita) serão retornados. substring_index executa uma correspondência que diferencia maiúsculas de minúsculas ao pesquisar por delimitamento.

Para a função SQL do Databricks correspondente, consulte a função substring_index.

Sintaxe

from pyspark.databricks.sql import functions as dbf

dbf.substring_index(str=<str>, delim=<delim>, count=<count>)

Parâmetros

Parâmetro	Tipo	Description
`str`	`pyspark.sql.Column` ou `str`	coluna de destino na qual trabalhar.
`delim`	`literal string`	delimitador de valores.
`count`	`int`	número de ocorrências.

Devoluções

pyspark.sql.Column: subcadeia de caracteres de determinado valor.

Exemplos

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()

Comentários

Esta página foi útil?

Last updated on 2026-02-01