sync
命令群組
注意
此資訊適用於處於公開預覽狀態 的 Databricks CLI 0.205 版和更新版本。 若要尋找 Databricks CLI 版本請執行 databricks -v
。
此外,請注意 sync
,命令群組可以將檔案變更從本機開發計算機同步處理到 Azure Databricks 工作區中的工作區使用者(/Users
) 檔案。 它無法同步處理至 DBFS (dbfs:/
) 檔案。 若要同步處理從本機開發計算機到 Azure Databricks 工作區中 DBFS (dbfs:/
) 的檔案變更,請使用 dbx 同步 公用程式。
sync
Databricks CLI 內的命令群組可將本機文件系統目錄中的檔案變更單向同步處理至遠端 Azure Databricks 工作區內的目錄。
注意
sync
命令無法同步處理遠端 Azure Databricks 工作區內目錄的檔案變更,回到本機文件系統內的目錄。
sync
您可以將命令附加至 來執行databricks sync
命令。 若要顯示命令的說明 sync
,請執行 databricks sync -h
。
重要
若要安裝 Databricks CLI,請參閱 安裝或更新 Databricks CLI。 若要設定 Databricks CLI 的驗證,請參閱 Databricks CLI 的驗證。
以累加方式同步處理遠端目錄的本機檔案變更
若要執行本機文件系統目錄內檔案變更的單一累加式單向同步處理,到遠端 Azure Databricks 工作區內的目錄,請執行 sync
命令,如下所示:
databricks sync <local-directory-path> <remote-directory-path>
例如,若要對本機目前工作目錄內名為 my-folder
的資料夾內的所有檔案變更執行一次性的單向累加同步處理,請執行下列命令:
databricks sync ./my-folder/ /Users/someone@example.com/
在這裡範例中,只會將命令上次執行 sync
後的檔案變更同步處理至 /Users/someone@example.com/
。 根據預設,呼叫端 DEFAULT
配置檔內的工作區URL會用來判斷要同步處理的遠端工作區。
將本機檔案變更完全同步至遠端目錄
若要執行單一、完整、單向同步處理本機文件系統目錄內的檔案變更,到遠端 Azure Databricks 工作區內的目錄,不論上次執行命令 sync
的時間為何,請使用 --full
選項,例如:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
持續同步本機檔案變更至遠端目錄
若要開啟本機文件系統目錄內檔案變更的連續單向同步處理,請在遠端 Azure Databricks 工作區內的目錄使用 --watch
選項,例如:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
單向同步處理會繼續進行,直到命令從終端機停止為止,通常是按 Ctrl + c
或 Ctrl + z
。
根據預設,輪詢可能的同步處理事件會發生一次。 若要變更此間隔,請使用 --interval
選項以及輪詢的秒數,後面接著字元 s
,例如 5 秒:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
變更同步處理進度輸出格式
同步處理進度資訊預設會以文字格式輸出至終端機。 若要指定同步處理進度輸出格式,請使用 --output
選項,指定 text
(如果未 --output
指定預設值)或 json
,例如:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json