Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Retorna a substring da cadeia de caracteres str antes de count ocorrências do delimitador delim. Se a contagem for positiva, tudo o que resta do delimitador final (contando da esquerda) será retornado. Se a contagem for negativa, todos à direita do delimitador final (contando da direita) serão retornados. substring_index executa uma correspondência que diferencia maiúsculas de minúsculas ao pesquisar por delimitamento.
Para a função SQL do Databricks correspondente, consulte a função substring_index.
Sintaxe
from pyspark.databricks.sql import functions as dbf
dbf.substring_index(str=<str>, delim=<delim>, count=<count>)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
str |
pyspark.sql.Column ou str |
coluna de destino na qual trabalhar. |
delim |
literal string |
delimitador de valores. |
count |
int |
número de ocorrências. |
Devoluções
pyspark.sql.Column: subcadeia de caracteres de determinado valor.
Exemplos
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()