Partilhar via


substring_index

Devolve a substring da string str antes de contar ocorrências do delimitador delim. Se a contagem for positiva, tudo o que está à esquerda do delimitador final (contando a partir da esquerda) é devolvido. Se a contagem for negativa, todo à direita do delimitador final (contando a partir da direita) é devolvido. substring_index realiza uma correspondência sensível de maiúsculas e minúsculas ao procurar delim.

Para a função SQL do Databricks correspondente, veja substring_index função.

Sintaxe

from pyspark.databricks.sql import functions as dbf

dbf.substring_index(str=<str>, delim=<delim>, count=<count>)

Parâmetros

Parâmetro Tipo Description
str pyspark.sql.Column ou str Coluna alvo para trabalhar.
delim literal string Delimitador de valores.
count int número de ocorrências.

Devoluções

pyspark.sql.Column: subcadeia de valor dado.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()