Partilhar via


CACHE TABLE

Aplica-se a: Marque Sim Databricks Runtime

Armazena em cache o conteúdo de uma tabela ou saída de uma consulta com o nível de armazenamento fornecido no cache do Apache Spark. Se uma consulta for armazenada em cache, uma exibição temporária será criada para essa consulta. Isso reduz a verificação dos arquivos originais em consultas futuras.

Sintaxe

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Consulte Cache de disco versus cache Spark para saber as diferenças entre o cache de disco e o cache do Apache Spark.

Parâmetros

  • Preguiçoso

    Armazene a tabela em cache apenas quando ela for usada pela primeira vez, em vez de imediatamente.

  • table_name

    Identifica a tabela Delta ou a exibição a ser armazenada em cache. O nome não deve incluir uma especificação temporal. Se a tabela não puder ser encontrada, o Azure Databricks gerará um erro de TABLE_OR_VIEW_NOT_FOUND .

  • OPTIONS ( 'storageLevel' [ = ] valor )

    OPTIONS cláusula com storageLevel par chave e valor. Um aviso é emitido quando uma chave diferente é storageLevel usada. As opções válidas para storageLevel são:

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Uma exceção é lançada quando um valor inválido é definido como storageLevel. Se storageLevel não for explicitamente definido usando OPTIONS a cláusula, o padrão storageLevel será definido como MEMORY_AND_DISK.

  • query

    Uma consulta que produz as linhas a serem armazenadas em cache. Pode ser em um dos seguintes formatos:

    • Uma SELECT declaração
    • Uma TABLE declaração
    • Uma FROM declaração

Exemplos

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;