Bagikan melalui


CACHE TABLE

Berlaku untuk:centang ditandai ya Databricks Runtime

Cache konten tabel atau output kueri dengan tingkat penyimpanan tertentu di cache Apache Spark. Jika kueri di-cache, tampilan sementara akan dibuat untuk kueri ini. Tindakan ini mengurangi pemindaian file asli di kueri mendatang.

Nota

Data yang di-cache dibagikan di semua sesi Spark pada kluster.

Sintaks

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Lihat Cache disk vs. Cache Spark untuk perbedaan antara penembolokan disk dan cache Apache Spark.

Parameter

  • MALAS

    Cache tabel hanya ketika pertama kali digunakan, bukan langsung.

  • table_name

    Mengidentifikasi tabel atau tampilan Delta untuk di-cache. Nama tidak boleh menyertakan spesifikasi temporal atau spesifikasi opsi. Jika tabel tidak dapat ditemukan, Azure Databricks menimbulkan kesalahan TABLE_OR_VIEW_NOT_FOUND.

  • OPTIONS ( 'storageLevel' [ = ] value )

    Klausul OPTIONS dengan pasangan kunci dan nilai storageLevel. Peringatan dikeluarkan ketika kunci selain storageLevel digunakan. Opsi yang valid untuk storageLevel adalah:

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Pengecualian terjadi ketika nilai tidak valid disetel untuk storageLevel. Jika storageLevel tidak diatur secara eksplisit menggunakan klausa OPTIONS, storageLevel default diatur ke MEMORY_AND_DISK.

  • kueri

    Kueri yang menghasilkan baris yang akan di-cache. Formatnya dapat menggunakan salah satu format berikut:

    • Pernyataan SELECT
    • Pernyataan TABLE
    • Pernyataan FROM

Contoh

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;