通过


VariantVal 类

一个类,表示 Python 中的 Variant 值。

Syntax

from pyspark.sql.types import VariantVal

VariantVal(value, metadata)

参数

参数 类型 说明
value 字节 表示 Variant 的值组件的字节。
metadata 字节 表示 Variant 的元数据组件的字节。

方法

方法 说明
toPython() 将 VariantVal 转换为 Python 数据结构。
toJson() 将 VariantVal 转换为 JSON 字符串。 区域 ID 表示时间戳应打印到的时区。 默认为 UTC。 可以通过导入 zoneinfo 模块并运行 zoneinfo.available_timezones()来找到有效区域 ID 的列表。
parseJson() 将 VariantVal 转换为 Python 数据类型的嵌套 Python 对象。

示例

from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''} ])
v = df.select(sf.parse_json(df.json).alias("var")).head().var
v.toPython()
# {'a': 1}
v.toJson()
# '{"a":1}'