Python에서 Variant 값을 나타내는 클래스입니다.
문법
from pyspark.sql.types import VariantVal
VariantVal(value, metadata)
매개 변수
| 매개 변수 |
유형 |
설명 |
value |
bytes |
Variant의 값 구성 요소를 나타내는 바이트입니다. |
metadata |
bytes |
Variant의 메타데이터 구성 요소를 나타내는 바이트입니다. |
메서드
| 메서드 |
설명 |
toPython() |
VariantVal을 Python 데이터 구조로 변환합니다. |
toJson() |
VariantVal을 JSON 문자열로 변환합니다. 영역 ID는 타임스탬프를 인쇄해야 하는 표준 시간대를 나타냅니다. 기본값은 UTC입니다. zoneinfo 모듈을 가져오고 실행 zoneinfo.available_timezones()하여 유효한 영역 ID 목록을 찾을 수 있습니다. |
parseJson() |
VariantVal을 Python 데이터 형식의 중첩된 Python 개체로 변환합니다. |
예제
from pyspark.sql import functions as sf
df = spark.createDataFrame([ {'json': '''{ "a" : 1 }'''} ])
v = df.select(sf.parse_json(df.json).alias("var")).head().var
v.toPython()
# {'a': 1}
v.toJson()
# '{"a":1}'