次の方法で共有


regexp_replace

regexp と一致する指定した文字列値のすべての部分文字列を置換に置き換えます。

対応する Databricks SQL 関数については、 regexp_replace 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.regexp_replace(string=<string>, pattern=<pattern>, replacement=<replacement>)

パラメーター

パラメーター タイプ Description
string pyspark.sql.Column または str 文字列値を含む列名または列
pattern pyspark.sql.Column または str regexp パターンを含む column オブジェクトまたは str
replacement pyspark.sql.Column または str 置換を含む column オブジェクトまたは str

例示

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[("100-200", r"(\d+)", "--")],
["str", "pattern", "replacement"]
)
df.select('*', dbf.regexp_replace('str', r'(\d+)', '--')).show()
df.select('*',
dbf.regexp_replace(dbf.col("str"), dbf.col("pattern"), dbf.col("replacement"))
).show()