依排程或持續執行作業
您可以使用已排程的觸發程式類型定期執行 Azure Databricks 作業,或確定一律會以連續觸發程式類型執行作業。
您可以使用排程,在指定的時間和期間自動執行 Azure Databricks 作業。 您可以定義簡單的排程,以定期執行作業,或用來 cron
定義定期排程特定時間的進階排程。 使用進階排程,您也可以選取排程的時區。 您可以隨時暫停排程的工作。
當您使用連續觸發程式執行作業時,Azure Databricks 作業可確保一律有一個作用中的作業執行。 新的作業執行會在上一次執行順利完成或狀態失敗之後啟動,如果目前沒有執行中作業的實例,則為 。
新增作業排程
排程觸發程式類型有兩個選項:
- 定義基本排程,以根據指定的時間單位和間隔定期執行作業。 例如,排程作業每隔 12 小時執行一次。
- 定義進階排程,以在運行作業期間、時間和時區提供更多控制權。
若要定義作業的排程:
- 在提要欄位中,按兩下 [ 工作流程]。
- 在 [作業] 索引標籤上的 [名稱] 資料列中,按兩下作業名稱。
- 在 [ 作業詳細數據] 面板中,按兩下 [ 新增觸發程式]。
- 在 [觸發程序類型 ] 中,選取 [ 已排程]。
- 在 [排程類型] 中,選取 [簡單] 或 [進階]。
- 按一下 [檔案] 。
您也可以直接在筆記本 UI 中排程筆記本作業。
注意
- Azure Databricks 會強制執行作業排程所觸發的後續執行之間的最小間隔 10 秒,而不論 cron 表達式中的秒組態為何。
- 您可以選擇觀察日光節約時間或 UTC 的時區。 如果您選取觀察日光節約時間的時區,則會略過每小時工作,或可能在日光節約時間開始或結束時延遲一兩小時。 若要每小時執行 (絕對時間),請選擇 [UTC]。
- 作業排程器不適用於低延遲作業。 由於網路或雲端問題,作業執行偶爾可能會延遲至數分鐘。 在這些情況下,排程的工作會在服務可用性時立即執行。
暫停和繼續作業排程
若要暫停作業,請按兩下 [作業詳細數據] 面板中的 [暫停]。
若要繼續暫停的作業排程,請按兩下 [ 繼續]。
執行連續作業
- 在提要欄位中,按兩下 [ 工作流程]。
- 在 [作業] 索引標籤上的 [名稱] 資料列中,按兩下作業名稱。
- 按兩下 [作業詳細資料] 面板中的 [新增觸發程式],按兩下 [作業詳細數據] 面板中的 [新增觸發程式],在 [觸發程式類型] 中選取 [連續],然後按兩下 [儲存]。
若要停止連續作業,請按兩下 [立即執行] 旁的 ,然後按兩下 [停止]。
注意
連續作業的失敗如何處理?
Azure Databricks 作業會使用 指數輪詢 配置來管理連續失敗的連續作業。 指數輪詢可讓連續作業在沒有暫停的情況下執行,並在發生可復原失敗時回到狀況良好的狀態。
當連續作業超過連續失敗的允許臨界值時,下列描述後續作業的執行管理方式:
- 工作會在系統設定的重試期間之後重新啟動。
- 如果下一個作業執行失敗,重試期間就會增加,而且作業會在這個新的重試期間之後重新啟動。
- 針對每個後續的作業執行失敗,重試期間會再次增加,最多為系統所設定的最大重試期間。 達到重試期間上限之後,工作會使用重試期間上限繼續重試。 連續作業的重試次數沒有限制。
- 如果作業執行順利完成並啟動新的執行,或如果執行超過臨界值而沒有失敗,則作業會視為狀況良好,而輪詢順序會重設。
您可以在作業 UI 中以指數輪詢狀態重新啟動連續作業,或在作業 2.0 API 中將作業標識符傳遞至 POST /api/2.1/jobs/run-now 要求,或 POST /api/2.0/jobs/run-now 要求。
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: