一个类,表示 Python 中的 Variant 值。
在 Databricks Runtime 15.2 中添加
Syntax
from pyspark.sql.types import VariantVal
VariantVal(value, metadata)
参数
| 参数 | 类型 | 说明 |
|---|---|---|
value |
字节 | 表示 Variant 的值组件的字节。 |
metadata |
字节 | 表示 Variant 的元数据组件的字节。 |
方法
| 方法 | 说明 |
|---|---|
toPython() |
将 VariantVal 转换为Python数据结构。 |
toJson() |
将 VariantVal 转换为 JSON 字符串。 区域 ID 表示时间戳应打印到的时区。 默认为 UTC。 可以通过导入 zoneinfo 模块并运行 zoneinfo.available_timezones()来找到有效区域 ID 的列表。 |
parseJson() |
将 VariantVal 转换为Python数据类型的嵌套Python对象。 |
示例
from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''} ])
v = df.select(sf.parse_json(df.json).alias("var")).head().var
v.toPython()
# {'a': 1}
v.toJson()
# '{"a":1}'