Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La subcadena comienza en pos y es de longitud cuando str es tipo string o devuelve el segmento de la matriz de bytes que comienza en pos byte y es de longitud lenlen cuando str es tipo binario.
La posición no está basada en cero, sino en un índice basado en 1.
Para obtener la función SQL de Databricks correspondiente, consulte substring function.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.substring(str=<str>, pos=<pos>, len=<len>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
str |
pyspark.sql.Column o str |
columna de destino en la que se va a trabajar. |
pos |
pyspark.sql.Column, str o int |
posición inicial en str. |
len |
pyspark.sql.Column, str o int |
longitud de caracteres. |
Devoluciones
pyspark.sql.Column: subcadena del valor especificado.
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()