部分文字列は、 pos で始まり、str が String 型の場合は長 len 。または、str が Binary 型の場合に pos バイトで始まり、長さが len バイト配列のスライスを返します。
位置は 0 から始まるのではなく、1 から始まるインデックスです。
対応する Databricks SQL 関数については、 substring 関数を参照してください。
構文
from pyspark.databricks.sql import functions as dbf
dbf.substring(str=<str>, pos=<pos>, len=<len>)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
str |
pyspark.sql.Column または str |
使用するターゲット列。 |
pos |
pyspark.sql.Column または str または int |
str の開始位置。 |
len |
pyspark.sql.Column または str または int |
文字の長さ。 |
返品ポリシー
pyspark.sql.Column: 指定された値の部分文字列。
例示
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('abcd',)], ['s',])
df.select('*', dbf.substring(df.s, 1, 2)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, df.l)).show()
df.select('*', dbf.substring(df.s, df.p, 3)).show()
df.select('*', dbf.substring(df.s, df.p, df.l)).show()
df = spark.createDataFrame([('Spark', 2, 3)], ['s', 'p', 'l'])
df.select('*', dbf.substring(df.s, 2, 'l')).show()
df.select('*', dbf.substring('s', 'p', 'l')).show()