Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Cria uma nova linha para uma coluna json de acordo com os nomes de campo especificados.
Sintaxe
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column ou str |
Coluna de cadeia de caracteres no formato json. |
fields |
Str | Um campo ou campos a serem extraídos. |
Devoluções
pyspark.sql.Column: uma nova linha para cada valor de campo fornecido do objeto json
Exemplos
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]