Condividi tramite


substring

La sottostringa inizia da pos e ha una lunghezza len quando str è di tipo String o restituisce la sezione della matrice di byte che inizia pos in byte ed è di lunghezza len quando str è di tipo Binary.

La posizione non è in base zero, ma 1 indice in base.

Per la funzione SQL di Databricks corrispondente, vedere substring funzione.

Sintassi

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Parametri

Parametro TIPO Description
str pyspark.sql.Column o str colonna di destinazione su cui lavorare.
pos pyspark.sql.Column o str o int posizione iniziale in str.
len pyspark.sql.Column o str o int lunghezza di caratteri.

Restituzioni

pyspark.sql.Column: sottostringa del valore specificato.

Esempi

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()