sync
группа команд
Примечание.
Эта информация относится к Интерфейсу командной строки Databricks версии 0.205 и выше. Интерфейс командной строки Databricks находится в общедоступной предварительной версии.
Использование интерфейса командной строки Databricks распространяется на лицензию Databricks и уведомление о конфиденциальности Databricks, включая все положения об использовании.
Группа sync
команд в интерфейсе командной строки Databricks позволяет односторонней синхронизации изменений файлов в локальном каталоге файловой системы в каталоге удаленной рабочей области Azure Databricks.
Примечание.
sync
команды не могут синхронизировать изменения файлов из каталога в удаленной рабочей области Azure Databricks, обратно в каталог в локальной файловой системе.sync
команды могут синхронизировать изменения файлов с локального компьютера разработки только с файлами пользователя рабочей области (/Users
) в рабочей области Azure Databricks. Он не может синхронизироваться с файлами DBFS (dbfs:/
). Чтобы синхронизировать изменения файлов с локального компьютера разработки с DBFS (dbfs:/
) в рабочей области Azure Databricks, используйте служебную программу синхронизации dbx.
Команды выполняются sync
путем добавления их в databricks sync
. Чтобы отобразить справку по команде sync
, выполните команду databricks sync -h
.
Добавочная синхронизация изменений локального файла с удаленным каталогом
Чтобы выполнить однократную и добавочную синхронизацию изменений файлов в локальном каталоге файловой системы, в каталог в удаленной рабочей области Azure Databricks выполните sync
команду следующим образом:
databricks sync <local-directory-path> <remote-directory-path>
Например, чтобы выполнить однократную одностороннюю синхронизацию всех изменений файлов в папке с именем my-folder
локального рабочего каталога, в определенный путь в удаленной рабочей области, выполните следующую команду:
databricks sync ./my-folder/ /Users/someone@example.com/
В этом примере синхронизированы /Users/someone@example.com/
только изменения файлов с момента последнего выполнения sync
команды. По умолчанию URL-адрес рабочей области в профиле вызывающего объекта DEFAULT
используется для определения удаленной рабочей области для синхронизации.
Полная синхронизация изменений локального файла в удаленном каталоге
Для выполнения одной полной односторонней синхронизации изменений файлов в локальном каталоге файловой системы с каталогом в удаленной рабочей области Azure Databricks независимо от того, когда была запущена последняя sync
команда, используйте --full
этот параметр, например:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Непрерывная синхронизация изменений локального файла с удаленным каталогом
Чтобы включить непрерывную односторонней синхронизацию изменений файлов в локальном каталоге файловой системы, в каталог в удаленной рабочей области Azure Databricks, используйте --watch
этот параметр, например:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
Односторонняя синхронизация продолжается, пока команда не будет остановлена из терминала, как правило, путем нажатия клавиши Ctrl + c
или Ctrl + z
.
Опрос возможных событий синхронизации происходит один раз в секунду по умолчанию. Чтобы изменить этот интервал, используйте --interval
параметр вместе с количеством секунд для опроса, за которым следует символ s
, например в течение пяти секунд:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Изменение формата выходных данных хода выполнения синхронизации
Сведения о ходе синхронизации выходные данные в терминале в текстовом формате по умолчанию. Чтобы указать формат выходных данных хода выполнения синхронизации, используйте --output
этот параметр, указав text
либо (значение по умолчанию, если --output
оно не указано в противном случае), либо json
, например:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json