将包含 JSON 字符串的列分析为 .VariantType 如果字符串包含无效的 JSON 值,则返回 None。
Syntax
from pyspark.sql import functions as sf
sf.try_parse_json(col)
参数
| 参数 | 类型 | Description |
|---|---|---|
col |
pyspark.sql.Column 或 str |
列名或列名 JSON 格式字符串。 |
退货
pyspark.sql.Column:VariantType 的新列。
例子
from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''}, {'json': '''{a : 1}'''} ])
df.select(sf.to_json(sf.try_parse_json(df.json))).collect()
[Row(to_json(try_parse_json(json))='{"a":1}'), Row(to_json(try_parse_json(json))=None)]