Поделиться через


regexp_replace

Замените все подстроки указанного строкового значения, соответствующего регрессии с заменой.

Для соответствующей функции Databricks SQL смотрите функцию regexp_replace.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.regexp_replace(string=<string>, pattern=<pattern>, replacement=<replacement>)

Параметры

Параметр Тип Description
string pyspark.sql.Column или str имя столбца или столбец, содержащий строковое значение
pattern pyspark.sql.Column или str объект столбца или str, содержащий шаблон regexp
replacement pyspark.sql.Column или str Объект столбца или str, содержащий замену

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[("100-200", r"(\d+)", "--")],
["str", "pattern", "replacement"]
)
df.select('*', dbf.regexp_replace('str', r'(\d+)', '--')).show()
df.select('*',
dbf.regexp_replace(dbf.col("str"), dbf.col("pattern"), dbf.col("replacement"))
).show()