Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Erstellt eine neue Zeile für eine JSON-Spalte gemäß den angegebenen Feldnamen.
Syntax
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Die Parameter
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column oder str |
Zeichenfolgenspalte im JSON-Format. |
fields |
str | Ein zu extrahierende Feld oder Felder. |
Rückkehr
pyspark.sql.Column: eine neue Zeile für jeden angegebenen Feldwert aus json-Objekt
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]