Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de changer d’annuaire.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer d’annuaire.
Analyse une chaîne JSON et déduit son schéma au format DDL.
Syntaxe
from pyspark.sql import functions as sf
sf.schema_of_json(json, options=None)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
json |
pyspark.sql.Column ou str |
Chaîne JSON ou colonne de chaîne pliable contenant une chaîne JSON. |
options |
dict, facultatif | Options pour contrôler l’analyse. Accepte les mêmes options que la source de données JSON. |
Retours
pyspark.sql.Column: représentation sous forme de chaîne d’un StructType élément analysé à partir de JSON donné.
Examples
import pyspark.sql.functions as sf
parsed1 = sf.schema_of_json(sf.lit('{"a": 0}'))
parsed2 = sf.schema_of_json('{a: 1}', {'allowUnquotedFieldNames':'true'})
spark.range(1).select(parsed1, parsed2).show()
+------------------------+----------------------+
|schema_of_json({"a": 0})|schema_of_json({a: 1})|
+------------------------+----------------------+
| STRUCT<a: BIGINT>| STRUCT<a: BIGINT>|
+------------------------+----------------------+