Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Задает уровень хранилища для сохранения содержимого кадра данных в операциях после первого вычисления. Это можно использовать только для назначения нового уровня хранения, если кадр данных еще не имеет набора уровней хранения. Если уровень хранилища не указан по умолчанию (MEMORY_AND_DISK_DESER).
Синтаксис
persist(storageLevel: StorageLevel = StorageLevel.MEMORY_AND_DISK_DESER)
Параметры
| Параметр | Тип | Описание |
|---|---|---|
storageLevel |
StorageLevel | Уровень хранилища, заданный для сохраняемости. Значение по умолчанию — MEMORY_AND_DISK_DESER. |
Возвраты
DataFrame: сохраненный кадр данных.
Примечания
Уровень хранения по умолчанию изменился на MEMORY_AND_DISK_DESER соответствие Scala в версии 3.0.
Кэшированные данные используются во всех сеансах Spark в кластере.
Примеры
df = spark.range(1)
df.persist()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...
from pyspark.storagelevel import StorageLevel
df.persist(StorageLevel.DISK_ONLY)
# DataFrame[id: bigint]