Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Crea una nueva fila para una columna json según los nombres de campo especificados.
Syntax
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column o str |
Columna de cadena en formato json. |
fields |
str | Campo o campos que se van a extraer. |
Devoluciones
pyspark.sql.Column: una nueva fila para cada valor de campo determinado del objeto json.
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]