regexp와 일치하는 지정된 문자열 값의 모든 부분 문자열을 대체로 바꿉니다.
해당 Databricks SQL 함수에 대해 알아보려면 regexp_replace 함수를 참조하세요.
문법
from pyspark.databricks.sql import functions as dbf
dbf.regexp_replace(string=<string>, pattern=<pattern>, replacement=<replacement>)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
string |
pyspark.sql.Column 또는 str |
문자열 값을 포함하는 열 이름 또는 열 |
pattern |
pyspark.sql.Column 또는 str |
regexp 패턴을 포함하는 열 개체 또는 str |
replacement |
pyspark.sql.Column 또는 str |
대체를 포함하는 열 개체 또는 str |
예시
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[("100-200", r"(\d+)", "--")],
["str", "pattern", "replacement"]
)
df.select('*', dbf.regexp_replace('str', r'(\d+)', '--')).show()
df.select('*',
dbf.regexp_replace(dbf.col("str"), dbf.col("pattern"), dbf.col("replacement"))
).show()