CACHE TABLE
S’applique à : Databricks Runtime
Met en cache le contenu d’une table ou d’une sortie de requête avec le niveau de stockage donné dans un cache Apache Spark. Si une requête est mise en cache, un affichage temporaire est créé pour cette requête. Cela réduit la charge d’analyse des fichiers d’origine dans les requêtes ultérieures.
Syntaxe
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Pour connaître les différences entre la mise en cache sur disque et le cache Apache Spark, consultez Cache de disque par rapport à la mise en cache Spark.
Paramètres
LAZY
Mettre la table en cache uniquement lors de sa première utilisation, plutôt qu’immédiatement.
-
Identifie la table ou vue Delta à mettre en cache. Le nom ne doit pas inclure de spécification temporelle ou de spécification d’options. Si la table est introuvable, Azure Databricks génère une erreur TABLE_OR_VIEW_NOT_FOUND.
OPTIONS ( ‘storageLevel’ [ = ] value )
Clause
OPTIONS
avec paire clé/valeurstorageLevel
. Un avertissement est émis lorsqu’une clé autre questorageLevel
est utilisée. Les options valides pourstorageLevel
sont les suivantes :NONE
DISK_ONLY
DISK_ONLY_2
MEMORY_ONLY
MEMORY_ONLY_2
MEMORY_ONLY_SER
MEMORY_ONLY_SER_2
MEMORY_AND_DISK
MEMORY_AND_DISK_2
MEMORY_AND_DISK_SER
MEMORY_AND_DISK_SER_2
OFF_HEAP
Une exception est levée quand une valeur non valide est définie pour
storageLevel
. SistorageLevel
n’est pas défini explicitement à l’aide de la clauseOPTIONS
, la valeur par défautstorageLevel
estMEMORY_AND_DISK
.query
Requête produisant les lignes à mettre en cache. Les formats possibles sont les suivants :
- Instruction
SELECT
- Instruction
TABLE
- Instruction
FROM
- Instruction
Exemples
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;