CACHE SELECT

适用于:勾选“是” Databricks Runtime

注意

在 SQL 仓库上或 Databricks Runtime 14.2 及更高版本中,函数 CACHE SELECT 被忽略。

磁盘缓存中缓存由指定的简单 SELECT 查询访问的数据。 可以通过提供列名称列表来选择要缓存的列的子集,并通过提供谓词来选择行的子集。 这使得后续查询可以尽可能避免扫描原始文件。 此构造仅适用于 Delta 表和 Parquet 表。 如上所述,还支持视图,但扩展的查询仅限于简单查询。

语法

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

请参阅磁盘缓存与Spark 缓存,了解磁盘缓存和 Apache Spark 缓存之间的差异。

参数

示例

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3