json (DataFrameWriter)

Сохраняет содержимое DataFrame в формате JSON (строки JSON или json с разделителями новой строки) по указанному пути.

Синтаксис

json(path, mode=None, compression=None, dateFormat=None, timestampFormat=None,
     lineSep=None, encoding=None, ignoreNullFields=None)

Параметры

Параметр Тип Описание
path str Путь в любой файловой системе, поддерживаемой Hadoop.
mode str, необязательный Поведение, когда данные уже существуют. Допустимые значения: 'append', 'overwrite', 'ignore'и 'error' (по 'errorifexists' умолчанию).

Возвраты

Нет

Примеры

Напишите кадр данных в JSON-файл и считывает его обратно.

import tempfile
with tempfile.TemporaryDirectory(prefix="json") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.json(d, mode="overwrite")

    spark.read.format("json").load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+