Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Devuelve la primera subcadena que coincide con la expresión regular regexp de Java dentro de la cadena str. Si no se encuentra la expresión regular, el resultado es NULL.
Para obtener la función SQL de Databricks correspondiente, consulte regexp_substr function.
Syntax
from pyspark.sql import functions as dbf
dbf.regexp_substr(str=<str>, regexp=<regexp>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
str |
pyspark.sql.Column o str |
columna de destino en la que se va a trabajar. |
regexp |
pyspark.sql.Column o str |
patrón regex que se va a aplicar. |
Examples
from pyspark.sql import functions as dbf
df = spark.createDataFrame([("1a 2b 14m", r"\d+")], ["str", "regexp"])
df.select('*', dbf.regexp_substr('str', dbf.lit(r'\d+'))).show()
df.select('*', dbf.regexp_substr('str', dbf.lit(r'mmm'))).show()
df.select('*', dbf.regexp_substr("str", dbf.col("regexp"))).show()
df.select('*', dbf.regexp_substr(dbf.col("str"), "regexp")).show()