Compartilhar via


grupo de comandos sync

Observação

Essas informações se aplicam às versões da CLI do Databricks 0.205 e superiores, que estão em Versão Prévia Pública. Para localizar sua versão da CLI do Databricks, execute databricks -v.

Além disso, observe que o grupo de comandos sync pode sincronizar alterações de arquivo de um computador de desenvolvimento local apenas para arquivos de usuário do workspace (/Users) no workspace do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivo de um computador de desenvolvimento local para o DBFS (dbfs:/) no workspace do Azure Databricks, use o utilitário de sincronização dbx.

O sync grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks.

Observação

Os comandos sync não podem sincronizar alterações de arquivo de um diretório em um workspace remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local.

Você executa sync comandos anexando-os a databricks sync. Para exibir a ajuda para o comando sync, execute databricks sync -h.

Importante

Para instalar a CLI do Databricks, consulte Instalar ou atualizar a CLI do Databricks. Para configurar a autenticação na CLI do Databricks, consulte Autenticação na CLI do Databricks.

Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização única e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório dentro de um workspace remoto do Azure Databricks, execute o comando sync da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta nomeada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, somente as alterações de arquivo desde a última execução do sync comando são sincronizadas com /Users/someone@example.com/. Por padrão, a URL do workspace no perfil do DEFAULT chamador é usada para determinar o workspace remoto ao qual sincronizar.

Sincronizar totalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização unidirecional única e completa de alterações de arquivo em um diretório de sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks, independentemente de quando o último sync comando foi executado, use a opção --full , por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente as alterações de arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um espaço de trabalho remoto do Azure Databricks, use a opção --watch, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido do terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por padrão. Para alterar esse intervalo, use a opção --interval juntamente com o número de segundos para sondar seguido pelo caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Alterar o formato de saída de progresso da sincronização

As informações de progresso da sincronização são a saída para o terminal no formato de texto por padrão. Para especificar o formato de saída de progresso da sincronização, use a opção --output especificando text (o padrão, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json