次の方法で共有


substring

部分文字列は、 pos で始まり、str が String 型の場合は長 len 。または、str が Binary 型の場合に pos バイトで始まり、長さが len バイト配列のスライスを返します。

位置は 0 から始まるのではなく、1 から始まるインデックスです。

対応する Databricks SQL 関数については、 substring 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.substring(str=<str>, pos=<pos>, len=<len>)

パラメーター

パラメーター タイプ Description
str pyspark.sql.Column または str 使用するターゲット列。
pos pyspark.sql.Column または str または int str の開始位置。
len pyspark.sql.Column または str または int 文字の長さ。

返品ポリシー

pyspark.sql.Column: 指定された値の部分文字列。

例示

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()