Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к:
Databricks Runtime
Кэширует содержимое таблицы или выходные данные запроса на заданном уровне хранилища в кэше Apache Spark. Если запрос кэшируется, для этого запроса создается временное представление. Это позволяет сократить число проверок исходных файлов при последующих запросах.
Замечание
Кэшированные данные используются во всех сеансах Spark в кластере.
Синтаксис
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Смотрите Кэш диска против кэша Spark, чтобы узнать о различиях между кэшированием на диске и кэшем Apache Spark.
Параметры
ЛЕНИВЫЙ
Кэшировать таблицу только при ее первом использовании, а не сразу.
-
Определяет таблицу Delta или представление для кэширования. Имя не должно включать темпоральную спецификацию или спецификацию параметров выбора. Если таблица не найдена, Azure Databricks вызывает ошибку TABLE_OR_VIEW_NOT_FOUND.
OPTIONS ( "storageLevel" [ = ] значение )
Пункт
OPTIONSс парой ключ — значениеstorageLevel. При использовании ключа, отличного отstorageLevel, выдается предупреждение. Допустимые параметры дляstorageLevel:NONEDISK_ONLYDISK_ONLY_2MEMORY_ONLYMEMORY_ONLY_2MEMORY_ONLY_SERMEMORY_ONLY_SER_2MEMORY_AND_DISKMEMORY_AND_DISK_2MEMORY_AND_DISK_SERMEMORY_AND_DISK_SER_2OFF_HEAP
Если для
storageLevelзадано недопустимое значение, создается исключение. ЕслиstorageLevelне задано явным образом в предложенииOPTIONS, по умолчанию дляstorageLevelустанавливается значениеMEMORY_AND_DISK.запрос
Запрос, создающий строки, которые нужно кэшировать. Он может быть представлен в одном из следующих форматов:
- Инструкция
SELECT - Инструкция
TABLE - Инструкция
FROM
- Инструкция
Примеры
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;