json_tuple

Cria uma nova linha para uma coluna json de acordo com os nomes de campo especificados.

Sintaxe

from pyspark.sql import functions as sf

sf.json_tuple(col, *fields)

Parâmetros

Parâmetro	Tipo	Description
`col`	`pyspark.sql.Column` ou str	Coluna de cadeia de caracteres no formato json.
`fields`	Str	Um campo ou campos a serem extraídos.

Devoluções

pyspark.sql.Column: uma nova linha para cada valor de campo fornecido do objeto json

Exemplos

from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()

[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]

Comentários

Esta página foi útil?

Last updated on 2026-02-01

Compartilhar via

json_tuple

Sintaxe

Parâmetros

Devoluções

Exemplos

Comentários

Recursos adicionais