Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Membuat baris baru untuk kolom json sesuai dengan nama bidang yang diberikan.
Syntax
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col |
pyspark.sql.Column atau str |
Kolom string dalam format json. |
fields |
str | Bidang atau bidang yang akan diekstrak. |
Pengembalian Barang
pyspark.sql.Column: baris baru untuk setiap nilai bidang yang diberikan dari objek json
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]