regexp_substr

Devuelve la primera subcadena que coincide con la expresión regular regexp de Java dentro de la cadena str. Si no se encuentra la expresión regular, el resultado es NULL.

Para obtener la función SQL de Databricks correspondiente, consulte regexp_substr function.

Syntax

from pyspark.sql import functions as dbf

dbf.regexp_substr(str=<str>, regexp=<regexp>)

Parámetros

Parámetro	Tipo	Description
`str`	`pyspark.sql.Column` o `str`	columna de destino en la que se va a trabajar.
`regexp`	`pyspark.sql.Column` o `str`	patrón regex que se va a aplicar.

Examples

from pyspark.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+")], ["str", "regexp"])

df.select('*', dbf.regexp_substr('str', dbf.lit(r'\d+'))).show()
df.select('*', dbf.regexp_substr('str', dbf.lit(r'mmm'))).show()
df.select('*', dbf.regexp_substr("str", dbf.col("regexp"))).show()
df.select('*', dbf.regexp_substr(dbf.col("str"), "regexp")).show()

Oharrak

Lagungarria al da orri hau?

Last updated on 2026-04-27