Поделиться через


sync группа команд

Примечание.

Эта информация относится к Интерфейсу командной строки Databricks версии 0.205 и выше. Интерфейс командной строки Databricks находится в общедоступной предварительной версии.

Использование интерфейса командной строки Databricks распространяется на лицензию Databricks и уведомление о конфиденциальности Databricks, включая все положения об использовании.

Группа sync команд в интерфейсе командной строки Databricks позволяет односторонней синхронизации изменений файлов в локальном каталоге файловой системы в каталоге удаленной рабочей области Azure Databricks.

Примечание.

  • sync команды не могут синхронизировать изменения файлов из каталога в удаленной рабочей области Azure Databricks, обратно в каталог в локальной файловой системе.
  • sync команды могут синхронизировать изменения файлов с локального компьютера разработки только с файлами пользователя рабочей области (/Users) в рабочей области Azure Databricks. Он не может синхронизироваться с файлами DBFS (dbfs:/). Чтобы синхронизировать изменения файлов с локального компьютера разработки с DBFS (dbfs:/) в рабочей области Azure Databricks, используйте служебную программу синхронизации dbx.

Команды выполняются sync путем добавления их в databricks sync. Чтобы отобразить справку по команде sync , выполните команду databricks sync -h.

Добавочная синхронизация изменений локального файла с удаленным каталогом

Чтобы выполнить однократную и добавочную синхронизацию изменений файлов в локальном каталоге файловой системы, в каталог в удаленной рабочей области Azure Databricks выполните sync команду следующим образом:

databricks sync <local-directory-path> <remote-directory-path>

Например, чтобы выполнить однократную одностороннюю синхронизацию всех изменений файлов в папке с именем my-folder локального рабочего каталога, в определенный путь в удаленной рабочей области, выполните следующую команду:

databricks sync ./my-folder/ /Users/someone@example.com/

В этом примере синхронизированы /Users/someone@example.com/только изменения файлов с момента последнего выполнения sync команды. По умолчанию URL-адрес рабочей области в профиле вызывающего объекта DEFAULT используется для определения удаленной рабочей области для синхронизации.

Полная синхронизация изменений локального файла в удаленном каталоге

Для выполнения одной полной односторонней синхронизации изменений файлов в локальном каталоге файловой системы с каталогом в удаленной рабочей области Azure Databricks независимо от того, когда была запущена последняя sync команда, используйте --full этот параметр, например:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Непрерывная синхронизация изменений локального файла с удаленным каталогом

Чтобы включить непрерывную односторонней синхронизацию изменений файлов в локальном каталоге файловой системы, в каталог в удаленной рабочей области Azure Databricks, используйте --watch этот параметр, например:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

Односторонняя синхронизация продолжается, пока команда не будет остановлена из терминала, как правило, путем нажатия клавиши Ctrl + c или Ctrl + z.

Опрос возможных событий синхронизации происходит один раз в секунду по умолчанию. Чтобы изменить этот интервал, используйте --interval параметр вместе с количеством секунд для опроса, за которым следует символ s, например в течение пяти секунд:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Изменение формата выходных данных хода выполнения синхронизации

Сведения о ходе синхронизации выходные данные в терминале в текстовом формате по умолчанию. Чтобы указать формат выходных данных хода выполнения синхронизации, используйте --output этот параметр, указав text либо (значение по умолчанию, если --output оно не указано в противном случае), либо json, например:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json