CACHE TABLE

Si applica a:segno di spunta sì Databricks Runtime

Memorizza nella cache il contenuto di una tabella o di un output di una query con il livello di archiviazione specificato nella cache di Apache Spark. Se una query viene memorizzata nella cache, viene creata una vista temporanea per questa query. In questo modo si riduce l'analisi dei file originali nelle query future.

Sintassi

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Per informazioni sulle differenze tra la memorizzazione nella cache del disco e la cache di Apache Spark, vedere Cache del disco e Cache Spark.

Parametri

  • PIGRO

    Memorizza nella cache solo la tabella quando viene usata per la prima volta, anziché immediatamente.

  • table_name

    Identifica la tabella o la vista Delta da memorizzare nella cache. Il nome non deve includere una specifica temporale. Se la tabella non è stata trovata, Azure Databricks genera un errore di TABLE_OR_VIEW_NOT_FOUND .

  • OPTIONS ( 'storageLevel' [ = ] value )

    OPTIONS clausola con storageLevel coppia chiave e valore. Viene generato un avviso quando viene usata una chiave diversa storageLevel da . Le opzioni valide per storageLevel sono:

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Viene generata un'eccezione quando viene impostato un valore non valido per storageLevel. Se storageLevel la clausola using OPTIONS non è impostata in modo esplicito, il valore predefinito storageLevel è impostato su MEMORY_AND_DISK.

  • query

    Query che produce le righe da memorizzare nella cache. Può essere in uno dei formati seguenti:

    • Un'istruzione SELECT
    • Un'istruzione TABLE
    • Un'istruzione FROM

Esempi

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;