Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Erstellt eine neue Zeile für eine JSON-Spalte gemäß den angegebenen Feldnamen.
Syntax
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Die Parameter
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column oder str |
Zeichenfolgenspalte im JSON-Format. |
fields |
str | Ein zu extrahierende Feld oder Felder. |
Rückkehr
pyspark.sql.Column: eine neue Zeile für jeden angegebenen Feldwert aus json-Objekt
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]