Compartilhar via


regexp_replace

Substitua todas as substrings do valor de cadeia de caracteres especificado que correspondem ao regexp por um valor de substituição.

Para a função SQL do Databricks correspondente, consulte a função regexp_replace.

Sintaxe

from pyspark.databricks.sql import functions as dbf

dbf.regexp_replace(string=<string>, pattern=<pattern>, replacement=<replacement>)

Parâmetros

Parâmetro Tipo Description
string pyspark.sql.Column ou str nome da coluna ou coluna que contém o valor da cadeia de caracteres
pattern pyspark.sql.Column ou str objeto column ou str contendo o padrão regexp
replacement pyspark.sql.Column ou str objeto column ou str que contém a substituição

Exemplos

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[("100-200", r"(\d+)", "--")],
["str", "pattern", "replacement"]
)
df.select('*', dbf.regexp_replace('str', r'(\d+)', '--')).show()
df.select('*',
dbf.regexp_replace(dbf.col("str"), dbf.col("pattern"), dbf.col("replacement"))
).show()