OPTIMIZE

適用於： 勾選是 Databricks SQL Databricks Runtime

本頁說明了 OPTIMIZE 該指令，該指令可優化 Delta Lake 資料的佈局。你可以優化部分資料，或依欄位排序資料。如果你沒有指定搭配，且表格沒有使用液體聚類，Delta Lake 會進行分箱優化。

語法

OPTIMIZE table_name [FULL] [WHERE predicate]
  [ZORDER BY (col_name1 [, ...] ) ]

注意

分箱包裝優化是 冪零式的：如果你在同一組資料上執行兩次，第二次則沒有影響。它能產生相對於磁碟大小的均衡資料檔案，但不一定能產生每個檔案元組數量。這兩種指標最常是相關聯的。

Z-序 序不是冪등的，而是以漸進方式運作。 Z 排序所需的時間不保證會隨著多次執行而減少。然而，如果僅是 Z 順序的分割區沒有新增資料，那麼在該分割區重新執行 Z 排序則無效。 Z 排序在元組數量上產生均衡的資料檔案，但不一定能在磁碟上產生資料大小。這兩個指標通常相關，但當兩者分歧時，優化任務時間可能會產生偏差。

注意

使用 Databricks 執行時，若要控制輸出檔案大小，請設定 Spark 設定spark.databricks.delta.optimize.maxFileSize。預設值為 1073741824 （1 GB）。指定時檔案 104857600 大小為 100 MB。

參數

table_name

識別現有的 Delta 數據表。名稱不得包含時態規格或選項規格。
FULL

適用於： Databricks Runtime 16.0 及更高版本

重寫表格中的所有資料檔案。用於 OPTIMIZE table_name FULL ：
- 優化整個資料表，包括先前被叢集的資料（用於液態叢集的資料表）。
- 當您使用delta.parquet.compression.codec屬性變更資料表的壓縮編解碼器時，請重新壓縮現有的資料檔案。
若要在更改壓縮編碼器後重新壓縮現有資料，請執行 OPTIMIZE table_name FULL：
```
-- Change compression codec
ALTER TABLE table_name SET TBLPROPERTIES ('delta.parquet.compression.codec' = 'ZSTD');

-- Recompress all existing data files
OPTIMIZE table_name FULL;
```
要優化啟用液態叢集的表格中部分檔案，請 FULL 結合 WHERE 謂詞（Databricks Runtime 18.1 及以上版本）。僅支援單一群集欄位的簡單範圍謂詞。若檔案的範圍中有任何部分與謂詞重疊，則該檔案即被包含。例如，包含 OPTIMIZE events FULL WHERE date > 15 一個帶有範圍 (col_min = 10, col_max = 20) 的檔案，因為該檔案的範圍與謂詞重疊。
WHERE

優化與分割區/叢集謂詞匹配的列子集。僅支援分割區/叢集的鍵屬性篩選。

對於使用液態叢集的資料表，請改用 OPTIMIZE table_name FULL WHERE predicate （Databricks Runtime 18.1 及以上版本）。
ZORDER BY

注意

Databricks 建議所有新資料表都採用液態叢集，而非 Z 排序。請參閱針對數據表使用液體叢集。

將欄位資訊集中在同一組檔案中。三角洲湖資料跳過演算法利用共局性來減少需要讀取的資料量。你可以將多欄指定為逗號分隔的清單，但共域性的效力會隨著每增加一欄而降低。

你不能在使用液體聚類的資料表上使用這個子句。

範例

> OPTIMIZE events;

> OPTIMIZE events FULL;

> -- Partitioned table
> OPTIMIZE events WHERE date >= '2017-01-01';

> -- Table with liquid clustering enabled (DBR 18.1 and above)
> OPTIMIZE events FULL WHERE date >= '2025-01-01';

> OPTIMIZE events
    WHERE date >= current_timestamp() - INTERVAL 1 day
    ZORDER BY (eventType);

欲了解更多資訊，請參閱優化資料檔案佈局。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-04-24

OPTIMIZE

語法

參數

範例

意見反應

其他資源