Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengekstrak bagian tertentu dari URL. Jika kunci disediakan, kunci akan mengembalikan nilai parameter kueri terkait.
Syntax
from pyspark.sql import functions as sf
sf.parse_url(url, partToExtract, key=None)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
url |
pyspark.sql.Column atau str |
Kolom string, masing-masing mewakili URL. |
partToExtract |
pyspark.sql.Column atau str |
Kolom string, masing-masing mewakili bagian untuk diekstrak dari URL. |
key |
pyspark.sql.Column atau str, opsional |
Kolom string, masing-masing mewakili kunci parameter kueri di URL. |
Pengembalian Barang
pyspark.sql.Column: Kolom baru string, masing-masing mewakili nilai bagian yang diekstrak dari URL.
Examples
Contoh 1: Mengekstrak bagian kueri dari URL
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "QUERY")],
["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
| query=1|
+--------------------+
Contoh 2: Mengekstrak nilai parameter kueri tertentu dari URL
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "QUERY", "query")],
["url", "part", "key"]
)
df.select(sf.parse_url(df.url, df.part, df.key)).show()
+-------------------------+
|parse_url(url, part, key)|
+-------------------------+
| 1|
+-------------------------+
Contoh 3: Mengekstrak bagian protokol dari URL
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "PROTOCOL")],
["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
| https|
+--------------------+
Contoh 4: Mengekstrak bagian host dari URL
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "HOST")],
["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
| spark.apache.org|
+--------------------+
Contoh 5: Mengekstrak bagian jalur dari URL
from pyspark.sql import functions as sf
df = spark.createDataFrame(
[("https://spark.apache.org/path?query=1", "PATH")],
["url", "part"]
)
df.select(sf.parse_url(df.url, df.part)).show()
+--------------------+
|parse_url(url, part)|
+--------------------+
| /path|
+--------------------+