get_json_object

基于指定的 json path 从 json 字符串中提取 json 对象，并返回提取的 json 对象的 json 字符串。如果输入 json 字符串无效，它将返回 null。

Syntax

from pyspark.sql import functions as sf

sf.get_json_object(col, path)

参数

参数	类型	Description
`col`	`pyspark.sql.Column` 或 str	json 格式的字符串列。
`path`	str	要提取的 json 对象的路径。

退货

pyspark.sql.Column：给定 JSON 对象值的字符串表示形式。

例子

示例 1：从 json 字符串中提取 json 对象

from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key,
    sf.get_json_object(df.jstring, '$.f1').alias("c0"),
    sf.get_json_object(df.jstring, '$.f2').alias("c1")
).show()

+---+-------+------+
|key|     c0|    c1|
+---+-------+------+
|  1| value1|value2|
|  2|value12|  NULL|
+---+-------+------+

示例 2：从 json 数组中提取 json 对象

from pyspark.sql import functions as sf
data = [
("1", '''[{"f1": "value1"},{"f1": "value2"}]'''),
("2", '''[{"f1": "value12"},{"f2": "value13"}]''')
]
df = spark.createDataFrame(data, ("key", "jarray"))
df.select(df.key,
    sf.get_json_object(df.jarray, '$[0].f1').alias("c0"),
    sf.get_json_object(df.jarray, '$[1].f2').alias("c1")
).show()

+---+-------+-------+
|key|     c0|     c1|
+---+-------+-------+
|  1| value1|   NULL|
|  2|value12|value13|
+---+-------+-------+

df.select(df.key,
    sf.get_json_object(df.jarray, '$[*].f1').alias("c0"),
    sf.get_json_object(df.jarray, '$[*].f2').alias("c1")
).show()

+---+-------------------+---------+
|key|                 c0|       c1|
+---+-------------------+---------+
|  1|["value1","value2"]|     NULL|
|  2|          "value12"|"value13"|
+---+-------------------+---------+

反馈

此页面是否有帮助？

Last updated on 2026-02-01

通过

get_json_object

Syntax

参数

退货

例子

反馈

其他资源