Udostępnij za pośrednictwem


sync grupa poleceń

Uwaga

Te informacje dotyczą interfejsu wiersza polecenia usługi Databricks w wersji 0.205 lub nowszej. Interfejs wiersza polecenia usługi Databricks jest w publicznej wersji demonstracyjnej.

Korzystanie z interfejsu wiersza polecenia usługi Databricks podlega licencjom usługi Databricks i powiadomieniom o ochronie prywatności usługi Databricks, w tym wszelkim przepisom dotyczącym danych użycia.

Grupa poleceń sync w interfejsie wiersza poleceń Databricks (CLI) umożliwia jednokierunkową synchronizację lokalnego kodu i zmian plików z katalogu na twoim lokalnym komputerze deweloperskim do folderu w zdalnym obszarze roboczym Azure Databricks.

Uwaga

  • sync Polecenia nie mogą synchronizować zmian plików z folderu w zdalnym obszarze roboczym usługi Azure Databricks z powrotem do katalogu na lokalnej maszynie dewelopera.
  • sync Polecenia mogą synchronizować zmiany plików z lokalnej maszyny dewelopera tylko do plików użytkownika obszaru roboczego (/Users) w obszarze roboczym usługi Azure Databricks. Nie można zsynchronizować plików DBFS (dbfs:/). Aby zsynchronizować zmiany w plikach z lokalnego komputera deweloperskiego do DBFS (dbfs:/) w przestrzeni roboczej Azure Databricks, użyj narzędzia dbx sync .

Uruchamiasz polecenia sync, dołączając je do databricks sync. Aby wyświetlić pomoc dotyczącą sync polecenia, uruchom polecenie databricks sync -h.

Przyrostowe synchronizowanie zmian w lokalnych plikach do katalogu zdalnego

Aby wykonać pojedynczą, przyrostową, jednokierunkową synchronizację zmian plików w katalogu lokalnym z folderem w zdalnym obszarze roboczym usługi Azure Databricks, uruchom sync polecenie w następujący sposób:

databricks sync <local-directory-path> <remote-directory-path>

Aby na przykład wykonać jednorazową, jednokierunkową synchronizację przyrostową wszystkich zmian plików w folderze o nazwie my-local-folder w lokalnym bieżącym katalogu roboczym, w folderze my-workspace-folder w zdalnym obszarze roboczym uruchom następujące polecenie:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

W tym przykładzie synchronizowane są jedynie zmiany plików od ostatniego uruchomienia polecenia sync z elementem /Users/someone@example.com/my-workspace-folder. Domyślnie adres URL obszaru roboczego w profilu obiektu wywołującego DEFAULT służy do określania zdalnego obszaru roboczego do synchronizacji.

Synchronizuj tylko określone pliki

Aby uwzględnić lub wykluczyć określone pliki do synchronizacji na podstawie określonych wzorców, użyj --includeopcji , --include-from, --excludelub --exclude-from .

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Uwaga

Jeśli chcesz zsynchronizować pliki w pakiecie, użyj sync mapowania konfiguracji. Zobacz sync.

W pełni synchronizuj zmiany pliku lokalnego z katalogiem zdalnym

Aby wykonać jedną, pełną, jednokierunkową synchronizację zmian plików w katalogu lokalnym z folderem w zdalnym obszarze roboczym usługi Azure Databricks, niezależnie od tego, kiedy zostało uruchomione ostatnie sync polecenie, użyj --full opcji, na przykład:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Ciągłe synchronizowanie zmian pliku lokalnego z katalogiem zdalnym

Aby włączyć ciągłą, jednokierunkową synchronizację zmian plików w katalogu lokalnym do folderu w zdalnym obszarze roboczym Azure Databricks, użyj opcji --watch, na przykład:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

Synchronizacja jednokierunkowa trwa do momentu zatrzymania polecenia z terminalu, zazwyczaj przez naciśnięcie Ctrl + c lub Ctrl + z.

Sondowanie możliwych zdarzeń synchronizacji odbywa się domyślnie raz na sekundę. Aby zmienić ten interwał, użyj --interval opcji wraz z liczbą sekund do sondowania, po którym następuje znak s, na przykład przez pięć sekund:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Zmień format danych wyjściowych postępu synchronizacji

Informacje o postępie synchronizacji są domyślnie wyświetlane w terminalu w formacie tekstowym. Aby określić format danych wyjściowych postępu synchronizacji, użyj opcji --output, określając text (wartość domyślna, jeśli --output nie została określona w inny sposób) lub json, na przykład:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Podgląd operacji na plikach dla synchronizacji

Aby wyświetlić podgląd synchronizacji bez wykonywania operacji synchronizacji plików, użyj --dry-run opcji, na przykład:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete