TABEL CACHE
Berlaku untuk: Databricks Runtime
Men-cache konten tabel atau output kueri dengan tingkat penyimpanan tertentu di cache Apache Spark. Jika kueri di-cache, tampilan sementara akan dibuat untuk kueri ini. Tindakan ini mengurangi pemindaian file asli di kueri mendatang.
Sintaks
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Lihat Cache disk vs. Cache Spark untuk perbedaan antara penembolokan disk dan cache Apache Spark.
Parameter
LAZY
Hanya meng-cache tabel saat pertama kali digunakan, tidak langsung.
-
Mengidentifikasi tabel Delta atau tampilan ke cache. Nama tidak boleh menyertakan spesifikasi temporal. Jika tabel tidak dapat ditemukan, Azure Databricks menimbulkan kesalahan TABLE_OR_VIEW_NOT_FOUND .
OPTIONS ( ‘storageLevel’ [ = ] value )
Klausul
OPTIONS
dengan pasangan kunci dan nilaistorageLevel
. Peringatan dikeluarkan ketika kunci selainstorageLevel
digunakan. Opsi yang valid untukstorageLevel
adalah:NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Pengecualian ditampilkan ketika nilai yang tidak valid ditetapkan untuk
storageLevel
. JikastorageLevel
tidak diatur secara eksplisit menggunakan klausaOPTIONS
, pengaturan defaultstorageLevel
akan ditetapkan keMEMORY_AND_DISK
.query
Kueri yang menghasilkan baris yang akan di-cache. Formatnya dapat menggunakan salah satu format berikut:
- Pernyataan
SELECT
- Pernyataan
TABLE
- Pernyataan
FROM
- Pernyataan
Contoh
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;