以下 Lakeflow Spark 宣告式管線的功能、改進及錯誤修正於 2026 年發布。
備註
由於 Lakeflow Spark 宣告式管線通道版本遵循輪流升級程式,因此通道升級會在不同時間部署至不同的區域。 您使用的版本,包括 Databricks Runtime 版本,可能在初始發布後一周或更長時間內不會獲得更新。 若要查詢目前 Databricks 管線的執行時版本,請參閱 執行時資訊。
2026 年 3 月
這些 Lakeflow Spark 宣告式管線的功能與改進於 2026 年 2 月 26 日至 2026 年 3 月 31 日期間發布。
此發行版使用的 Databricks 執行環境版本
以下版本截至 2026 年 3 月 31 日為最新版本。
頻道:
- 目前(預設):Databricks 執行環境 17.3.8
- 預覽:Databricks 執行環境 18.1.0
新功能和改善
- 無伺服器管線現在支援基於 CPU 的垂直自動擴展。 此功能會根據實際 CPU 利用率動態調整叢集資源,以提升工作負載穩定性。
- 現在你可以在刪除管線時保留 Unity 目錄資料表,即使管線移除後也能保留資料資產。 這讓你在管理管線生命週期時有更大的彈性,同時避免資料遺失的風險。
- 你現在可以使用新的流程語法建立串流資料表,這提供了更直接、宣告式的方式來定義串流資料管線。 這簡化了管線編寫,並與當前的資料工程模式相符。
- 現在已提供用於工作觸發管線的管線鉤子。 在 Lakeflow Jobs 的管線更新前後,使用它們來執行自訂邏輯。 管線鉤子擴展了自動化功能,用於協調式資料處理。
- 管線現在會在資料表更新時保留列過濾器與欄遮罩設定,讓您的 Unity 目錄安全政策在管線更新期間保持完整。 這可防止結構演化過程中意外移除安全政策。
- 現在,CDC 套用變更時支援日期時間基準重定模式。 此功能能正確處理舊有與現代日曆系統之間的時間戳轉換。 防止在透過變更數據捕捉流程處理歷史日期時間資料時發生的不一致性。
- 你現在可以在串流管線的操作中使用
foreachBatchSQL 語句,使微批次處理邏輯更具彈性。 這消除了過去需要 Python 或 Scala 來自訂批次處理的限制。 - 管線現在支援匯流器註冊中的前向參考。 你可以在資料表宣告前,定義參考下游資料表的資料流。 這簡化了複雜的管線定義並消除排序限制。
- Append-once 類型的流程現在在試運行時會進行驗證,這樣可以在管道執行開始之前捕捉到設定錯誤。 這能提升開發體驗,能在流程撰寫流程中更早發現問題。
錯誤修正
此發布期間未包含重大錯誤修正。 所有變更都是新功能與改進。
2026年2月
這些 Lakeflow Spark 宣告式管線的功能與改進於 2026 年 1 月 14 日至 2026 年 2 月 25 日期間發布。
此發行版使用的 Databricks 執行環境版本
以下版本截至 2026 年 2 月 25 日為最新版本。
頻道:
- 目前(預設):Databricks Runtime 17.3
- 預覽:Databricks 執行環境 17.3
新功能和改善
- 管線現在支援 Delta 表格的類型擴展,允許欄位資料型別安全地擴展(例如,
INT擴展至LONG,FLOAT擴展至DOUBLE),而無需進行管線的完全重置。 這使得過去需要人工介入的結構演化工作流程得以實現。 - 你現在可以使用 SCD Type 1 實體化 和
AUTO CDC, 提供更簡單的 CDC 模式,能在不維護完整變更歷史的情況下,插入或更新最新的值。 這在不需要完整歷史的使用情境中,降低了儲存開銷。 - 資料管線現在在重試因更新失敗的流程時會重用現有的叢集,藉由消除因啟動叢集所產生的冗餘時間,降低重試延遲並降低計算成本。
- 預測優化功能啟用現在會在已更新的實體化檢視和串流表上正確顯示,但前提是它們在過去一個月內有更新過。
- 管線現已能同時驗證多個流程,在執行開始前的模擬階段中,捕捉各流程之間的配置衝突和依賴性問題。
- 在擷取流程更新時,可更改的元資料會被保留,使得在擷取串流資料表上完整支援「ALTER」指令。
- 管線中的 Python 錯誤現在帶有 SQL 狀態碼,改善錯誤診斷,並使下游工具能更好地處理程式錯誤。
- 管線現已支援經典運算的 ARM 實例。
錯誤修正
- 附錄式串流表中的身份欄位值現在會在第一次更新執行時正確產生。
2026 年 1 月
這些 Lakeflow Spark 宣告式管線的功能與改進於 2025 年 11 月 14 日至 2026 年 1 月 13 日期間發布。
此發行版使用的 Databricks 執行環境版本
以下版本截至2026年1月13日為最新版本。
頻道:
- 目前(預設):Databricks Runtime 17.3
- 預覽:Databricks 執行環境 17.3
新功能和改善
你現在可以直接在 Unity 目錄資料表中儲存和管理資料品質期望,透過資料治理框架集中管理資料品質規則。 這使得可跨多個管線共享的版本控制、可稽核品質規則成為可能。
連續執行超過 7 天的管線現在可以優雅地重啟,停機時間最小,並明確說明更新原因(
INFRASTRUCTURE_MAINTENANCE),而不是在底層計算需要刷新時突然重啟。管線現在支援排隊執行模式,該模式會自動排隊並依序執行多個更新請求,而非因衝突而失敗。 這簡化了需要頻繁更新觸發的管線作業,並免除了手動協調重試的需求。
你現在可以從單一變更資料來源實現多個 SCD Type 2 視圖,提升建立同一資料多重歷史視圖的效率。 這消除了對每個 SCD Type 2 輸出重新處理來源資料的需求。
管線排程與設定現在可從 Unity 目錄的資料表屬性儲存與讀取,透過資料治理實現集中管理設定。 這讓你能在資料定義的同時管理管線行為。
MANAGE權限現在會自動傳播到 Unity 目錄中的實體化檢視與串流資料表,簡化了管線輸出的權限管理。 這確保了存取控制的一致性,無需手動授權。SCD Type 2 操作現在會自動合併具有相同自然鍵的重複記錄,確保資料一致性,並防止緩慢變動的維度表出現重複的歷史紀錄。
管線現在有選項自動丟棄不再屬於管線定義的非活躍資料表。 這有助於維持資料倉儲的乾淨,並降低因過時資料表產生的儲存成本。 請參閱 使用 Unity 目錄搭配管線。
管線定義、修補操作及執行身分變更現已包含在稽核日誌中,提供完整追蹤配置變更,以便進行合規與安全監控。 請參閱 管線事件記錄檔。
錯誤修正
此發布期間未包含重大錯誤修正。 所有變更都是新功能與改進。