substring

La subcadena comienza en pos y es de longitud cuando str es tipo string o devuelve el segmento de la matriz de bytes que comienza en pos byte y es de longitud lenlen cuando str es tipo binario.

La posición no está basada en cero, sino en un índice basado en 1.

Para obtener la función SQL de Databricks correspondiente, consulte substring function.

Syntax

from pyspark.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Parámetros

Parámetro	Tipo	Description
`str`	`pyspark.sql.Column` o `str`	columna de destino en la que se va a trabajar.
`pos`	`pyspark.sql.Column`, `str` o `int`	posición inicial en str.
`len`	`pyspark.sql.Column`, `str` o `int`	longitud de caracteres.

Devoluciones

pyspark.sql.Column: subcadena del valor especificado.

Examples

from pyspark.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()

Oharrak

Lagungarria al da orri hau?

Last updated on 2026-04-27