Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Hiermee maakt u een nieuwe rij voor een json-kolom op basis van de opgegeven veldnamen.
Syntaxis
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parameterwaarden
| Kenmerk | Typologie | Description |
|---|---|---|
col |
pyspark.sql.Column of str |
Tekenreekskolom in json-indeling. |
fields |
Str | Een veld of velden die moeten worden geëxtraheerd. |
Retouren
pyspark.sql.Column: een nieuwe rij voor elke opgegeven veldwaarde van json-object
Voorbeelden
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]