Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Применимо к:
Databricks Runtime
Кэширует содержимое таблицы или выходные данные запроса на заданном уровне хранилища в кэше Apache Spark. Если запрос кэшируется, для этого запроса создается временное представление. Это позволяет сократить число проверок исходных файлов при последующих запросах.
Замечание
Кэшированные данные используются во всех сеансах Spark в кластере.
Синтаксис
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Смотрите Кэш диска против кэша Spark, чтобы узнать о различиях между кэшированием на диске и кэшем Apache Spark.
Параметры
ЛЕНИВЫЙ
Кэшировать таблицу только при ее первом использовании, а не сразу.
-
Определяет таблицу Delta или представление для кэширования. Имя не должно включать темпоральную спецификацию или спецификацию параметров выбора. Если таблица не найдена, Azure Databricks вызывает ошибку TABLE_OR_VIEW_NOT_FOUND.
OPTIONS ( "storageLevel" [ = ] значение )
Пункт
OPTIONSс парой ключ — значениеstorageLevel. При использовании ключа, отличного отstorageLevel, выдается предупреждение. Допустимые параметры дляstorageLevel:NONEDISK_ONLYDISK_ONLY_2MEMORY_ONLYMEMORY_ONLY_2MEMORY_ONLY_SERMEMORY_ONLY_SER_2MEMORY_AND_DISKMEMORY_AND_DISK_2MEMORY_AND_DISK_SERMEMORY_AND_DISK_SER_2OFF_HEAP
Если для
storageLevelзадано недопустимое значение, создается исключение. ЕслиstorageLevelне задано явным образом в предложенииOPTIONS, по умолчанию дляstorageLevelустанавливается значениеMEMORY_AND_DISK.запрос
Запрос, создающий строки, которые нужно кэшировать. Он может быть представлен в одном из следующих форматов:
- Инструкция
SELECT - Инструкция
TABLE - Инструкция
FROM
- Инструкция
Примеры
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;