Delen via


substring

De subtekenreeks begint bij pos en is van lengte len wanneer str het tekenreekstype is of het segment van de bytematrix retourneert die begint bij pos byte en lengte len heeft wanneer str binair type is.

De positie is niet op nul gebaseerd, maar op basis van 1 index.

Voor de overeenkomstige Databricks SQL-functie, zie de substring functie.

Syntaxis

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

Parameterwaarden

Kenmerk Typologie Description
str pyspark.sql.Column of str doelkolom waaraan moet worden gewerkt.
pos pyspark.sql.Columnof strint beginpositie in str.
len pyspark.sql.Columnof strint lengte van tekens.

Retouren

pyspark.sql.Column: subtekenreeks van de opgegeven waarde.

Voorbeelden

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()