Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
La subcadena comienza en pos y es de longitud cuando str es tipo string o devuelve el segmento de la matriz de bytes que comienza en pos byte y es de longitud lenlen cuando str es tipo binario.
La posición no está basada en cero, sino en un índice basado en 1.
Para obtener la función SQL de Databricks correspondiente, consulte substring function.
Syntax
from pyspark.sql import functions as dbf
dbf.substring(str=<str>, pos=<pos>, len=<len>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
str |
pyspark.sql.Column o str |
columna de destino en la que se va a trabajar. |
pos |
pyspark.sql.Column, str o int |
posición inicial en str. |
len |
pyspark.sql.Column, str o int |
longitud de caracteres. |
Devoluciones
pyspark.sql.Column: subcadena del valor especificado.
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()