Freigeben über


substring

Teilzeichenfolge beginnt mit pos und ist länge len , wenn str den String-Typ ist oder das Segment des Bytearrays zurückgibt, das bei pos Byte beginnt und länge len ist, wenn str als Binärer Typ festgelegt ist.

Die Position ist nicht nullbasiert, sondern 1 basierender Index.

Die entsprechende Databricks SQL-Funktion finden Sie unter substring Funktion.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Die Parameter

Parameter Typ Description
str pyspark.sql.Column oder str Zielspalte, an der gearbeitet werden soll.
pos pyspark.sql.Column oder str oder int Startposition in str.
len pyspark.sql.Column oder str oder int Länge von Zeichen.

Rückkehr

pyspark.sql.Column: Teilzeichenfolge des angegebenen Werts.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()