Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Note
Эта информация относится к Интерфейсу командной строки Databricks версии 0.205 и выше. Интерфейс командной строки Databricks находится в общедоступной предварительной версии.
Использование интерфейса командной строки Databricks подчиняется лицензии Databricks и уведомлению о конфиденциальности Databricks, включая любые положения о данных использования.
Группа sync команд в интерфейсе командной строки Databricks позволяет односторонней синхронизации локальных изменений кода и файлов в каталоге на локальном компьютере разработки в папку в удаленной рабочей области Azure Databricks.
Note
-
syncНе удается синхронизировать изменения файлов из папки в удаленной рабочей области Azure Databricks обратно в каталог на локальном компьютере разработки. -
syncможет синхронизировать изменения файлов с локального компьютера разработки только с файлами пользователя рабочей области (/Users) в рабочей области Azure Databricks. Он не может синхронизироваться с файлами DBFS (dbfs:/). Чтобы синхронизировать изменения файлов с локального компьютера разработки с DBFS (dbfs:/) в рабочей области Azure Databricks, используйте служебную программу синхронизации dbx .
Синхронизация Databricks
Синхронизация локального каталога с каталогом рабочей области.
databricks sync [flags] SRC DST
Arguments
SRC
Путь к исходному каталогу
DST
Путь к целевому каталогу
Options
--dry-run
Имитация выполнения синхронизации без внесения фактических изменений
--exclude strings
Шаблоны для исключения из синхронизации (можно указать несколько раз)
--exclude-from string
Файл, содержащий шаблоны для исключения из синхронизации (один шаблон на строку)
--full
Выполнение полной синхронизации (по умолчанию — добавочная)
--include strings
Шаблоны для включения в синхронизацию (можно указать несколько раз)
--include-from string
Файл, содержащий шаблоны для синхронизации (один шаблон на строку)
--interval duration
Интервал опроса файловой системы (для --watch) (по умолчанию 1s)
--watch
Отслеживание изменений в локальной файловой системе
Examples
В следующих разделах показано, как использовать sync команду.
Пошаговая синхронизация изменений локальных файлов с удаленным каталогом
Чтобы выполнить однократную добавочную синхронизацию изменений файлов в локальном каталоге в папку в удаленной рабочей области Azure Databricks, выполните sync команду следующим образом:
databricks sync <local-directory-path> <remote-directory-path>
Например, чтобы выполнить однократную одностороннюю синхронизацию всех изменений файлов в папке с именем my-local-folder в локальном текущем рабочем каталоге, в папку my-workspace-folder в удаленной рабочей области выполните следующую команду:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder
В этом примере только изменения файлов с момента последнего выполнения команды sync синхронизированы с /Users/someone@example.com/my-workspace-folder. По умолчанию URL-адрес рабочей области в профиле вызывающего объекта DEFAULT используется для определения удаленной рабочей области для синхронизации.
Синхронизация только определенных файлов
Чтобы включить или исключить определенные файлы для синхронизации на основе указанных шаблонов, используйте --includeпараметр , --include-from--excludeили --exclude-from параметры.
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore
Note
Если вы хотите синхронизировать файлы в пакете, используйте sync конфигурационное сопоставление. См. синхронизацию с.
В следующем примере некоторые шаблоны файлов исключаются из синхронизации:
databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder
Полная синхронизация изменений локального файла в удаленном каталоге
Для выполнения одной полной односторонней синхронизации изменений файлов в локальном каталоге в папку в удаленной рабочей области Azure Databricks независимо от того, когда была запущена последняя sync команда, используйте --full этот параметр, например:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full
Непрерывная синхронизация изменений локального файла с удаленным каталогом
Чтобы включить непрерывную одностороннюю синхронизацию изменений файлов из локального каталога в папку в удаленной рабочей области Azure Databricks, используйте параметр --watch, например:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch
Односторонняя синхронизация продолжается, пока команда не будет остановлена из терминала, как правило, путем нажатия клавиши Ctrl + c или Ctrl + z.
Опрос возможных событий синхронизации происходит один раз в секунду по умолчанию. Чтобы изменить этот интервал, используйте --interval параметр вместе с количеством секунд для опроса, за которым следует символ s, например в течение пяти секунд:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s
Измените формат вывода прогресса синхронизации
Информация о ходе синхронизации выводится в терминале в текстовом формате по умолчанию. Чтобы указать формат выходных данных хода синхронизации, используйте параметр --output, указав либо text (значение по умолчанию, если --output не указано в противном случае), либо json, например:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json
Предварительный просмотр операций с файлами для синхронизации
Чтобы предварительно просмотреть синхронизацию без выполнения операций синхронизации файлов, используйте --dry-run этот параметр, например:
databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete
Глобальные флаги
--debug
Следует ли включить ведение журнала отладки.
-h или --help
Отобразить справку по интерфейсу командной строки Databricks, связанной группе команд или отдельной команде.
--log-file струна
Строка, представляющая файл для записи журналов выходных данных. Если этот флаг не указан, по умолчанию используется запись журналов выходных данных в stderr.
--log-format формат
Тип формата журнала: text или json. Значение по умолчанию — text.
--log-level струна
Строка, представляющая уровень формата журнала. Если не указано, уровень формата журнала отключен.
типа -o, --output
Тип выходных данных команды: text или json. Значение по умолчанию — text.
-p, --profile струна
Имя профиля в ~/.databrickscfg файле, используемого для выполнения команды. Если флаг не указан, используется профиль DEFAULT, если он существует.
--progress-format формат
Формат для отображения журналов хода выполнения: default, appendinplace, илиjson
-t, --target струна
Если применимо, целевой объект пакета для использования