지정된 필드 이름에 따라 json 열에 대한 새 행을 만듭니다.
문법
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
col |
pyspark.sql.Column 또는 str |
json 형식의 문자열 열입니다. |
fields |
스트링 | 추출할 필드 또는 필드입니다. |
Returns
pyspark.sql.Column: json 개체의 지정된 각 필드 값에 대한 새 행
예시
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]