TABEL CACHE

Berlaku untuk:centang ditandai ya Databricks Runtime

Men-cache konten tabel atau output kueri dengan tingkat penyimpanan tertentu di cache Apache Spark. Jika kueri di-cache, tampilan sementara akan dibuat untuk kueri ini. Tindakan ini mengurangi pemindaian file asli di kueri mendatang.

Sintaks

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Lihat Cache disk vs. Cache Spark untuk perbedaan antara penembolokan disk dan cache Apache Spark.

Parameter

  • LAZY

    Hanya meng-cache tabel saat pertama kali digunakan, tidak langsung.

  • table_name

    Mengidentifikasi tabel Delta atau tampilan ke cache. Nama tidak boleh menyertakan spesifikasi temporal. Jika tabel tidak dapat ditemukan, Azure Databricks menimbulkan kesalahan TABLE_OR_VIEW_NOT_FOUND .

  • OPTIONS ( ‘storageLevel’ [ = ] value )

    Klausul OPTIONS dengan pasangan kunci dan nilai storageLevel. Peringatan dikeluarkan ketika kunci selain storageLevel digunakan. Opsi yang valid untuk storageLevel adalah:

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Pengecualian ditampilkan ketika nilai yang tidak valid ditetapkan untuk storageLevel. Jika storageLevel tidak diatur secara eksplisit menggunakan klausa OPTIONS, pengaturan default storageLevel akan ditetapkan ke MEMORY_AND_DISK.

  • query

    Kueri yang menghasilkan baris yang akan di-cache. Formatnya dapat menggunakan salah satu format berikut:

    • Pernyataan SELECT
    • Pernyataan TABLE
    • Pernyataan FROM

Contoh

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;