Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Ez a speciális verzió parse_url ugyanazt a műveletet hajtja végre, de null értéket ad vissza ahelyett, hogy hibát jelezne, ha az elemzés nem hajtható végre.
Szemantika
from pyspark.sql import functions as sf
sf.try_parse_url(url, partToExtract, key=None)
Paraméterek
| Paraméter | Típus | Description |
|---|---|---|
url |
pyspark.sql.Column vagy str |
Sztringek oszlopa, amelyek mindegyike EGY URL-címet jelöl. |
partToExtract |
pyspark.sql.Column vagy str |
Sztringek oszlopa, amelyek mindegyike az URL-címből kinyerni kívánt részt jelöli. |
key |
pyspark.sql.Column vagy str, nem kötelező |
Sztringek oszlopa, amelyek mindegyike egy lekérdezési paraméter kulcsát jelöli az URL-címben. |
Visszatérítések
pyspark.sql.Column: Egy új sztringoszlop, amely az URL-címből kinyert rész értékét jelöli.
Példák
1. példa: A lekérdezési rész kinyerése URL-címből
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "QUERY")],
["url", "part"]
)
df.select(sf.try_parse_url(df.url, df.part)).show()
+------------------------+
|try_parse_url(url, part)|
+------------------------+
| query=1|
+------------------------+
2. példa: Adott lekérdezési paraméter értékének kinyerése EGY URL-címből
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "QUERY", "query")],
["url", "part", "key"]
)
df.select(sf.try_parse_url(df.url, df.part, df.key)).show()
+-----------------------------+
|try_parse_url(url, part, key)|
+-----------------------------+
| 1|
+-----------------------------+
3. példa: A protokollrész kinyerése EGY URL-címből
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "PROTOCOL")],
["url", "part"]
)
df.select(sf.try_parse_url(df.url, df.part)).show()
+------------------------+
|try_parse_url(url, part)|
+------------------------+
| https|
+------------------------+
4. példa: A gazdagéprész kinyerése URL-címből
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "HOST")],
["url", "part"]
)
df.select(sf.try_parse_url(df.url, df.part)).show()
+------------------------+
|try_parse_url(url, part)|
+------------------------+
| spark.apache.org|
+------------------------+
5. példa: Az elérésiút-rész kinyerése EGY URL-címből
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "PATH")],
["url", "part"]
)
df.select(sf.try_parse_url(df.url, df.part)).show()
+------------------------+
|try_parse_url(url, part)|
+------------------------+
| /path|
+------------------------+
6. példa: Érvénytelen URL-cím
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("inva lid://spark.apache.org/path?query=1", "QUERY", "query")],
["url", "part", "key"]
)
df.select(sf.try_parse_url(df.url, df.part, df.key)).show()
+-----------------------------+
|try_parse_url(url, part, key)|
+-----------------------------+
| NULL|
+-----------------------------+