通过


json_object_keys

以数组形式返回最外层 JSON 对象的所有键。 如果给定了有效的 JSON 对象,则最外部对象的所有键都将作为数组返回。 如果它是任何其他有效的 JSON 字符串、无效的 JSON 字符串或空字符串,则该函数将返回 null。

Syntax

from pyspark.sql import functions as sf

sf.json_object_keys(col)

参数

参数 类型 Description
col pyspark.sql.Column 或 str 要计算的目标列。

退货

pyspark.sql.Column:最外层 JSON 对象的所有键。

例子

from pyspark.sql import functions as sf
df = spark.createDataFrame([(None,), ('{}',), ('{"key1":1, "key2":2}',)], ['data'])
df.select(sf.json_object_keys(df.data).alias('r')).collect()
[Row(r=None), Row(r=[]), Row(r=['key1', 'key2'])]