共用方式為


json_tuple

根據給定的欄位名稱,為 JSON 資料表中的某一欄建立一列新資料。

語法

from pyspark.sql import functions as sf

sf.json_tuple(col, *fields)

參數

參數 類型 Description
col pyspark.sql.Column 或 str JSON 格式的字串欄位。
fields str 一個或多個需要提取的田地。

退貨

pyspark.sql.Column:每個給定欄位值從 JSON 物件中新增一列

範例

from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]