共用方式為


設定無伺服器管線

本文說明無伺服器管線的設定。

Databricks 建議使用無伺服器開發新的管線。 某些工作負載可能需要設定傳統計算或使用舊版 Hive 中繼存放區。 請參閱 為管線設定經典運算使用 Lakeflow Spark 宣告式管線搭配舊版 Hive 中繼存放區

備註

  • 無伺服器管線一律使用 Unity 目錄。 請參閱 使用 Unity 目錄搭配管線
  • 如需瞭解無伺服器計算的限制,請參閱
  • 您無法在無伺服器管線的 JSON 組態中,於 clusters 物件中手動新增計算設定。 嘗試這樣做會導致錯誤。
  • 如果您需要將 Azure Private Link 連線與無伺服器 Lakeflow Spark 宣告式管線搭配使用,請連絡您的 Databricks 代表。

需求

  • 您的工作區必須啟用 Unity 目錄,才能使用無伺服器管線。
  • 您的工作區必須位於支援無伺服器的 區域

這很重要

設定無伺服器管線不需要叢集建立許可權。 根據預設,所有工作區使用者都可以使用無伺服器管線。

無伺服器管線會移除大部分的組態選項,因為 Azure Databricks 會管理所有基礎結構。 當您建立新的管線時,預設值是使用無伺服器。 若要瞭解如何設定無伺服器管線,請參閱 設定管線

您也可以將使用 Unity 目錄設定的現有管線轉換成使用無伺服器。 請參閱如何將現有的管線轉換成伺服器無伺服的執行模式

其他設定考慮

下列組態選項也適用於無伺服器管線:

  • 在生產環境中執行管線時,您可以選擇使用持續管線模式。 請參閱 觸發式與連續管線模式
  • 根據成功或失敗條件,新增電子郵件更新通知 。 請參閱 ,新增有關管線事件的電子郵件通知
  • 使用 [組態] 字段來設定管線的索引鍵/值組。 這些組態有兩個用途:
  • 使用 預覽 通道來測試您的管線,以應對即將變更的 Lakeflow Spark 宣告式管線執行階段並試用新功能。

無伺服器預算原則

這很重要

這項功能目前處於 公開預覽版

無伺服器預算原則可讓您的組織在無伺服器使用量上套用自定義標籤,以取得細微的計費屬性。 選取 [無伺服器] 複選框之後,預算原則 設定隨即出現,您可以在其中選取要套用至管線的原則。 標籤繼承自無伺服器預算政策,只能由工作區管理員進行編輯。

備註

您獲指派無伺服器預算政策後,現有的管線不會自動標記此政策。 如果您想要將原則附加至現有管線,您必須手動更新這些管線。

如需進一步了解無伺服器預算政策,請參閱 無伺服器預算政策的屬性使用

選取效能模式

針對觸發的管線,您可以使用管線排程器中的 [效能優化 ] 設定來選取無伺服器計算效能模式。 停用此設定時,管線會使用標準效能模式。 標準效能模式的設計目的是要降低可接受略高啟動延遲的工作負載成本。 使用標準效能模式的無伺服器工作負載通常會在觸發后四到六分鐘內啟動,視計算可用性和優化排程而定。

啟用 效能優化 時,管線會針對效能進行優化,進而加快對時間敏感工作負載的啟動和執行速度。

這兩種模式都使用相同的 SKU,但標準效能模式會耗用較少的 DBU,反映較低的計算使用量。

備註

若要在連續管線中使用標準效能模式,請連絡您的 Databricks 客戶小組。

無伺服器管線功能

除了簡化設定之外,無伺服器管線還有下列功能:

  • 具象化檢視的增量重新整理:只要可能,具象化檢視的更新將以增量方式重新整理。 累加式重新整理的結果與完整重新計算的結果相同。 如果無法按步驟累加計算結果,更新將採用完整刷新。 如需具體化檢視 ,請參閱累加式重新整理。
  • 串流管線化:為了改善串流數據工作負載的使用率、輸送量和延遲,微批次數據會被管線化處理,例如在數據擷取過程中。 換句話說,無伺服器 Lakeflow Spark 宣告式管線不會像標準 Spark 結構化串流那樣循序執行微批次,而是同時執行微批次,從而提高計算資源使用率。 串流管線預設會在無伺服器管線中啟用。
  • 垂直自動調整:無伺服器 Lakeflow Spark 宣告式管線在 Databricks 增強型自動調整所提供的水平自動調整之外,會自動配置最具成本效益的實例類型來執行您的管線,避免因記憶體不足錯誤而導致失敗。 請參閱 什麼是垂直自動調整?

將現有的管線轉換為使用無伺服器架構

您可以使用 Unity 目錄設定的現有管線轉換成無伺服器管線。 完成下列步驟:

  1. 在 Azure Databricks 工作區的側邊欄中,點擊 作業和管線
  2. 點擊管線的名稱
  3. 點選 [設定]
  4. 在右側邊欄的 [計算] 底下,按一下 [鉛筆圖示..]。
  5. 勾選 無伺服器旁的方塊。
  6. 點選 [儲存]。

這很重要

當您啟用無伺服器時,會移除您為管線設定的任何計算設定。 如果您將管線切換回非無伺服器更新,則必須將所需的計算設定重新設定為管線組態。

如何尋找無伺服器管線的 DBU 使用量?

您可以查詢可計費使用量資料表 (Azure Databricks 系統資料表的一部分) 來尋找無伺服器 Lakeflow Spark 宣告式管線的 DBU 使用量。 請參閱 無伺服器管線的 DBU 耗用量為何?