Sdílet prostřednictvím


Příkaz sync

Note

Tyto informace platí pro Databricks CLI verze 0.205 a vyšší. Rozhraní příkazového řádku Databricks je ve veřejné ukázce.

Použití rozhraní příkazového řádku Databricks podléhá licenci Databricks a oznámení o ochraně osobních údajů Databricks, včetně všech ustanovení o využití.

Skupina sync příkazů v rozhraní příkazového řádku Databricks umožňuje jednosměrnou synchronizaci místního kódu a souborů v adresáři na místním vývojovém počítači do složky ve vzdáleném pracovním prostoru Azure Databricks.

Note

  • sync Aplikace nemůže synchronizovat změny souborů ze složky ve vzdáleném pracovním prostoru Azure Databricks zpět do adresáře na místním vývojovém počítači.
  • sync může synchronizovat změny souborů z místního vývojového počítače pouze na soubory uživatelů pracovního prostoru (/Users) v pracovním prostoru Azure Databricks. Nemůže se synchronizovat se soubory DBFS (dbfs:/). Pokud chcete synchronizovat změny souborů z místního vývojového počítače do DBFS (dbfs:/) v pracovním prostoru Azure Databricks, použijte synchronizační nástroj dbx .

Synchronizace Databricks

Synchronizujte místní adresář s adresářem pracovního prostoru.

databricks sync [flags] SRC DST

Arguments

SRC

    Cesta ke zdrojovému adresáři

DST

    Cesta k cílovému adresáři

Možnosti

--dry-run

    Simulace provádění synchronizace bez provádění skutečných změn

--exclude strings

    Vzory, které se mají vyloučit ze synchronizace (je možné zadat vícekrát)

--exclude-from string

    Soubor obsahující vzory, které se mají vyloučit ze synchronizace (jeden vzor na řádek)

--full

    Provést úplnou synchronizaci (výchozí hodnota je přírůstková)

--include strings

    Vzory, které se mají zahrnout do synchronizace (je možné zadat vícekrát)

--include-from string

    Soubor obsahující vzory, které se mají zahrnout k synchronizaci (jeden vzor na řádek)

--interval duration

    Interval dotazování systému souborů (pro --watch) (výchozí 1s)

--watch

    Sledování změn v místním systému souborů

Globální příznaky

Examples

Následující části ukazují, jak příkaz použít sync .

Přírůstková synchronizace místních změn souborů do vzdáleného adresáře.

Pokud chcete provést jednu přírůstkovou jednosměrnou synchronizaci souborů v místním adresáři do složky ve vzdáleném pracovním prostoru Azure Databricks, spusťte sync příkaz takto:

databricks sync <local-directory-path> <remote-directory-path>

Pokud například chcete provést jednorázovou jednosměrnou přírůstkovou synchronizaci všech změn souborů ve složce pojmenované my-local-folder v místním aktuálním pracovním adresáři, spusťte my-workspace-folder následující příkaz:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder

V tomto příkladu se synchronizují pouze změny souboru sync od posledního spuštění příkazu /Users/someone@example.com/my-workspace-folder. Ve výchozím nastavení se adresa URL pracovního prostoru v profilu volajícího DEFAULT používá k určení vzdáleného pracovního prostoru, do které se má synchronizovat.

Synchronizace jenom konkrétních souborů

Pokud chcete zahrnout nebo vyloučit konkrétní soubory pro synchronizaci na základě zadaných vzorů, použijte možnost --include, --include-from, --excludenebo --exclude-from možnosti.

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --exclude-from .gitignore

Note

Pokud chcete synchronizovat soubory v sadě, použijte sync místo toho mapování konfigurace. Viz synchronizace.

Následující příklad vyloučí určité vzory souborů ze synchronizace:

databricks sync --exclude "*.pyc" --exclude "__pycache__" ./my-local-folder /Users/someone@example.com/my-workspace-folder

Úplná synchronizace změn místních souborů do vzdáleného adresáře

Pokud chcete provést jednu úplnou jednosměrnou synchronizaci souborů v místním adresáři do složky ve vzdáleném pracovním prostoru Azure Databricks bez ohledu na to, kdy sync byl poslední příkaz spuštěn, použijte --full tuto možnost, například:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --full

Průběžné synchronizace změn místního souboru do vzdáleného adresáře

Pokud chcete zapnout průběžnou jednosměrnou synchronizaci změn souborů v místním adresáři do složky ve vzdáleném pracovním prostoru Azure Databricks, použijte --watch tuto možnost, například:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch

Jednosměrná synchronizace pokračuje, dokud se příkaz z terminálu nezastaví, obvykle stisknutím Ctrl + c nebo Ctrl + z.

Dotazování na možné synchronizační události se ve výchozím nastavení provádí jednou za sekundu. Pokud chcete tento interval změnit, použijte --interval možnost spolu s počtem sekund k dotazování následovaným znakem s, například po dobu pěti sekund:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --watch --interval 5s

Změna výstupního formátu průběhu synchronizace

Informace o průběhu synchronizace jsou ve výchozím nastavení výstupem do terminálu v textovém formátu. Pokud chcete zadat výstupní formát průběhu synchronizace, použijte možnost --output a zadejte text (výchozí nastavení, pokud --output není jinak zadáno) nebo json, například:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --output json

Náhled operací se soubory pro synchronizaci

Pokud chcete zobrazit náhled synchronizace bez skutečného --dry-run provádění operací synchronizace souborů, použijte tuto možnost, například:

databricks sync ./my-local-folder /Users/someone@example.com/my-workspace-folder --dry-run
Warn: Running in dry-run mode. No actual changes will be made.
Action: PUT: test.txt
Uploaded test.txt
Initial Sync Complete

Globální příznaky

--debug

  Zda povolit protokolování ladění.

-h nebo --help

    Zobrazení nápovědy k rozhraní příkazového řádku Databricks nebo související skupině příkazů nebo souvisejícímu příkazu

--log-file řetězec

    Řetězec představující soubor, do kterého se zapisují výstupní protokoly. Pokud tento příznak není zadaný, výchozí hodnota je zápis výstupních protokolů do stderru.

--log-format formát

    Typ formátu protokolu, text nebo json. Výchozí hodnota je text.

--log-level řetězec

    Řetězec představující úroveň formátu protokolu. Pokud není zadána, je úroveň formátu protokolu zakázaná.

-o, --output typ

    Typ výstupu příkazu, text nebo json. Výchozí hodnota je text.

-p, --profile řetězec

    Název profilu v ~/.databrickscfg souboru, který se má použít ke spuštění příkazu. Pokud tento příznak není zadán, použije se profil s názvem DEFAULT, pokud existuje.

--progress-format formát

    Formát pro zobrazení protokolů průběhu: default, append, inplacenebo json

-t, --target řetězec

    Pokud je to relevantní, cílový balíček, který se má použít