Megosztás:


parse_url

Kinyer egy meghatározott részt URL-címből. Ha egy kulcs meg van adva, az visszaadja a társított lekérdezési paraméter értékét.

Szemantika

from pyspark.sql import functions as sf

sf.parse_url(url, partToExtract, key=None)

Paraméterek

Paraméter Típus Description
url pyspark.sql.Column vagy str Sztringek oszlopa, amelyek mindegyike EGY URL-címet jelöl.
partToExtract pyspark.sql.Column vagy str Sztringek oszlopa, amelyek mindegyike az URL-címből kinyerni kívánt részt jelöli.
key pyspark.sql.Column vagy str, nem kötelező Sztringek oszlopa, amelyek mindegyike egy lekérdezési paraméter kulcsát jelöli az URL-címben.

Visszatérítések

pyspark.sql.Column: Egy új sztringoszlop, amely az URL-címből kinyert rész értékét jelöli.

Példák

1. példa: A lekérdezési rész kinyerése URL-címből

from pyspark.sql import functions as sf
df = spark.createDataFrame(
  [("https://spark.apache.org/path?query=1", "QUERY")],
  ["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
|             query=1|
+--------------------+

2. példa: Adott lekérdezési paraméter értékének kinyerése EGY URL-címből

from pyspark.sql import functions as sf
df = spark.createDataFrame(
  [("https://spark.apache.org/path?query=1", "QUERY", "query")],
  ["url", "part", "key"]
)
df.select(sf.parse_url(df.url, df.part, df.key)).show()
+-------------------------+
|parse_url(url, part, key)|
+-------------------------+
|                        1|
+-------------------------+

3. példa: A protokollrész kinyerése EGY URL-címből

from pyspark.sql import functions as sf
df = spark.createDataFrame(
  [("https://spark.apache.org/path?query=1", "PROTOCOL")],
  ["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
|               https|
+--------------------+

4. példa: A gazdagéprész kinyerése URL-címből

from pyspark.sql import functions as sf
df = spark.createDataFrame(
  [("https://spark.apache.org/path?query=1", "HOST")],
  ["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
|    spark.apache.org|
+--------------------+

5. példa: Az elérésiút-rész kinyerése EGY URL-címből

from pyspark.sql import functions as sf
df = spark.createDataFrame(
  [("https://spark.apache.org/path?query=1", "PATH")],
  ["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
|               /path|
+--------------------+