substring

Teilzeichenfolge beginnt mit pos und ist länge len , wenn str den String-Typ ist oder das Segment des Bytearrays zurückgibt, das bei pos Byte beginnt und länge len ist, wenn str als Binärer Typ festgelegt ist.

Die Position ist nicht nullbasiert, sondern 1 basierender Index.

Die entsprechende Databricks SQL-Funktion finden Sie unter substring Funktion.

Syntax

from pyspark.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Die Parameter

Parameter	Typ	Description
`str`	`pyspark.sql.Column` oder `str`	Zielspalte, an der gearbeitet werden soll.
`pos`	`pyspark.sql.Column` oder `str` oder `int`	Startposition in str.
`len`	`pyspark.sql.Column` oder `str` oder `int`	Länge von Zeichen.

Rückkehr

pyspark.sql.Column: Teilzeichenfolge des angegebenen Werts.

Examples

from pyspark.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()

Feedback

War diese Seite hilfreich?

Last updated on 2026-06-04