CACHE TABLE
Aplica-se a: Databricks Runtime
Armazena em cache o conteúdo de uma tabela ou saída de uma consulta com o nível de armazenamento fornecido no cache do Apache Spark. Se uma consulta for armazenada em cache, uma exibição temporária será criada para essa consulta. Isso reduz a verificação dos arquivos originais em consultas futuras.
Sintaxe
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Consulte Cache de disco versus cache Spark para saber as diferenças entre o cache de disco e o cache do Apache Spark.
Parâmetros
Preguiçoso
Armazene a tabela em cache apenas quando ela for usada pela primeira vez, em vez de imediatamente.
-
Identifica a tabela Delta ou a exibição a ser armazenada em cache. O nome não deve incluir uma especificação temporal. Se a tabela não puder ser encontrada, o Azure Databricks gerará um erro de TABLE_OR_VIEW_NOT_FOUND .
OPTIONS ( 'storageLevel' [ = ] valor )
OPTIONS
cláusula comstorageLevel
par chave e valor. Um aviso é emitido quando uma chave diferente éstorageLevel
usada. As opções válidas parastorageLevel
são:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Uma exceção é lançada quando um valor inválido é definido como
storageLevel
. SestorageLevel
não for explicitamente definido usandoOPTIONS
a cláusula, o padrãostorageLevel
será definido comoMEMORY_AND_DISK
.query
Uma consulta que produz as linhas a serem armazenadas em cache. Pode ser em um dos seguintes formatos:
- Uma
SELECT
declaração - Uma
TABLE
declaração - Uma
FROM
declaração
- Uma
Exemplos
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;