Sdílet prostřednictvím


CACHE TABLE

Platí pro:označeno zaškrtnutím ano Databricks Runtime

Ukládá obsah tabulky nebo výstupu dotazu do mezipaměti Apache Spark s danou úrovní úložiště. Pokud je dotaz uložen v mezipaměti, vytvoří se pro tento dotaz dočasné zobrazení. To snižuje kontrolu původních souborů v budoucích dotazech.

Poznámka:

Data uložená v mezipaměti se sdílí napříč všemi relacemi Sparku v clusteru.

Syntaxe

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Pro informace o rozdílech mezi mezipamětí disku a mezipamětí Sparku, viz Disk Cache vs. Spark Cache.

Parametry

  • LÍNÝ

    Tabulku uložíte do mezipaměti pouze při prvním použití místo okamžitého použití.

  • table_name

    Identifikuje tabulku nebo zobrazení Delta pro uložení do mezipaměti. Název nesmí obsahovat dočasnou specifikaci ani specifikaci možností. Pokud tabulku nenajdete, Azure Databricks vyvolá TABLE_OR_VIEW_NOT_FOUND chybu.

  • MOŽNOSTI ( 'úroveňUkládání' [ = ] hodnota )

    OPTIONS klauzule s dvojicí storageLevel klíč a hodnota. Pokud se použije jiný klíč než storageLevel, zobrazí se upozornění. Platné možnosti pro storageLevel :

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Výjimka je vyvolána v případě, že je nastavena neplatná hodnota pro storageLevel. Pokud není explicitně nastavena pomocí klauzule storageLevel, výchozí hodnota OPTIONS je nastavena na storageLevel.

  • dotaz

    Dotaz, který vytvoří řádky, které se mají uložit do mezipaměti. Může být v jednom z následujících formátů:

    • Příkaz SELECT
    • Příkaz TABLE
    • Příkaz FROM

Příklady

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;