Compartir a través de


substring

La subcadena comienza en pos y es de longitud cuando str es tipo string o devuelve el segmento de la matriz de bytes que comienza en pos byte y es de longitud lenlen cuando str es tipo binario.

La posición no está basada en cero, sino en un índice basado en 1.

Para obtener la función SQL de Databricks correspondiente, consulte substring function.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Parámetros

Parámetro Tipo Description
str pyspark.sql.Column o str columna de destino en la que se va a trabajar.
pos pyspark.sql.Column, str o int posición inicial en str.
len pyspark.sql.Column, str o int longitud de caracteres.

Devoluciones

pyspark.sql.Column: subcadena del valor especificado.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()