Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Crée une ligne pour une colonne json en fonction des noms de champs donnés.
Syntaxe
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
col |
pyspark.sql.Column ou str |
Colonne de chaîne au format json. |
fields |
str | Champ ou champs à extraire. |
Retours
pyspark.sql.Column: nouvelle ligne pour chaque valeur de champ donnée à partir d’un objet json
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]