Solução de problemas de erros para pastas Git do Databricks

Esta página descreve erros comuns e comportamento inesperado ao usar Azure Databricks pastas Git com um provedor Git remoto, agrupado por categoria para ajudá-lo a identificar a causa mais rapidamente. Se nenhuma das diretrizes aqui resolver seu problema, consulte Obter ajuda.

Erros de autenticação

Esses erros ocorrem quando Azure Databricks não pode verificar sua identidade com o provedor Git remoto.

Invalid credentials

Experimente o seguinte:

  • Confirme se as configurações de integração do Git (Configurações>Contas vinculadas) estão corretas. Você deve inserir o nome de usuário e o token do provedor do Git.

  • Confirme se você selecionou o provedor Git correto em contas vinculadas de >.

  • Verifique se o token de acesso pessoal ou a senha do aplicativo tem o acesso correto ao repositório.

  • Se o provedor Git tiver o SSO habilitado, autorize seus tokens para o SSO.

  • Teste seu token com a linha de comando do Git. Substitua as cadeias de caracteres de texto entre colchetes angulares:

    git clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git
    

Erros de conexão SSL

<link>: Secure connection to <link> could not be established because of SSL problems

Esse erro ocorre quando Azure Databricks não consegue acessar o servidor Git por HTTPS. Normalmente, isso indica um problema de conectividade de rede ou um problema de certificado TLS na infraestrutura git da sua organização.

Antes de entrar em contato com sua equipe de conta Azure Databricks, tenha as seguintes informações prontas:

  • URL do seu servidor Git
  • Se o servidor usa um certificado de AC autoassinado ou privado
  • Se outros usuários no mesmo workspace veem o mesmo erro

Erro de credenciais no Microsoft Entra ID

Encountered an error with your :re[ms-entra-id] credentials. Try logging out of :re[ms-entra-id] and logging back in.

Esse erro pode ocorrer quando sua organização habilitou recentemente uma política de MFA (autenticação multifator). Quando a exigência de MFA entrar em vigor, as sessões existentes do Microsoft Entra ID poderão não atender aos novos requisitos de autenticação, e a conexão falhará.

Para resolver o erro:

  1. Vá para portal.azure.com e saia do Microsoft Entra ID.
  2. Faça logon novamente. Você deve ver um prompt para concluir a MFA.

Se isso não funcionar, faça logoff de todos os serviços Azure antes de fazer logon novamente.

Erros de estado do repositório

Esses erros ocorrem quando a pasta git local atinge um estado que impede operações normais.

Estado de cabeçalho desanexado

No Git, o "HEAD" refere-se à posição atual no histórico de commits e normalmente aponta para uma ramificação. Quando o HEAD aponta diretamente para um commit específico em vez de um branch, o repositório está em um estado de "HEAD destacado". O Git não rastreia as alterações feitas nesse estado em nenhuma branch. Se você sair daqui sem antes criar um novo branch, essas alterações poderão ser perdidas.

Uma pasta Git pode inserir o estado de cabeçalho desanexado quando:

  • Alguém exclui o branch remoto. Azure Databricks tenta recuperar alterações locais não confirmadas aplicando-as ao branch padrão. Se houver alterações conflitantes, o Azure Databricks as aplica em um instantâneo do ramo padrão, resultando em um HEAD destacado.
  • Um usuário ou entidade de serviço retira uma tag usando a API update repo.

Para se recuperar desse estado:

  1. Clique em Criar ramificação para criar uma ramificação a partir do commit atual, ou em Selecionar ramificação para alternar para uma ramificação existente.
  2. Faça commit e push para manter suas alterações. Para descartar alterações, clique no ícone de menu Kebab. Menu kebab em Alterações.

Estado do repositório inconsistente

There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.

Esse erro indica que ocorreu um problema ao excluir pastas. O repositório agora está em um estado inconsistente. Exclua e clone novamente o repositório para redefinir seu estado.

Conflitos de nomes de cadernos

Notebooks com nomes de arquivo idênticos ou semelhantes podem causar erros ao criar um repositório ou solicitação de pull:

Cannot perform Git operation due to conflicting names
A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).

Conflitos de nomenclatura podem ocorrer mesmo com extensões de arquivo diferentes. Por exemplo, esses dois arquivos entram em conflito:

  • notebook.ipynb
  • notebook.py

Diagrama: conflito de nome de notebook, arquivo ou pasta.

Para corrigir o conflito, renomeie o bloco de anotações, o arquivo ou a pasta que está contribuindo para o estado de erro. Se o erro ocorrer quando você clonar o repositório, renomeie os blocos de anotações, arquivos ou pastas no repositório Git remoto.

Comportamento inesperado

Esses problemas não produzem uma mensagem de erro clara, mas são sinais de um problema que precisa de investigação.

Erros de Timeout

Operações como clonar um repositório grande ou verificar uma ramificação grande podem resultar em erros de tempo limite. A operação ainda pode ser concluída em segundo plano após o tempo limite expirar.

Se você vir um erro de tempo limite:

  1. Aguarde alguns minutos e atualize a pasta Git. Se os arquivos ou branches esperados estiverem presentes, a operação será concluída com êxito.
  2. Se o espaço de trabalho estava sob carga elevada, repita a operação após a carga diminuir.

Para evitar tempo limite com repositórios grandes, use check-out esparso para trabalhar somente com os arquivos de que você precisa.

Erros 404

Se você receber um erro 404 ao abrir um arquivo não notebook, aguarde alguns minutos e tente novamente. Há um breve atraso entre o momento em que o sistema habilita o workspace e o aplicativo web aplica a configuração.

Notebooks aparecem modificados sem edições do usuário

Se cada linha de um bloco de anotações aparecer modificada sem edições de usuário, as alterações provavelmente ocorrerão devido a diferenças de término de linha. Azure Databricks usa terminações de linha no estilo Linux (LF), que podem ser diferentes dos arquivos confirmados em sistemas de Windows (CRLF).

Para diagnosticar esse problema, verifique se você tem um .gitattributes arquivo:

  • Ele não pode conter * text eol=crlf.
  • Se você não estiver usando o Windows, remova essa configuração. Seu ambiente de desenvolvimento e Azure Databricks usam terminações de linha do Linux.
  • Se você estiver usando o Windows, altere a configuração para * text=auto. O Git armazena arquivos com terminações de linha no estilo Linux internamente, mas faz check-out com terminações de linha específicas da plataforma automaticamente.

Se você já tiver feito commit de arquivos com caracteres de fim de linha do Windows no Git:

  1. Exclua quaisquer alterações restantes.
  2. Atualize o .gitattributes arquivo conforme descrito acima para seu ambiente.
  3. Confirme a alteração.
  4. Execute git add --renormalize. Confirme e envie todas as alterações por push.

Recuperar arquivos excluídos

A capacidade de recuperação de arquivo varia de acordo com a ação. Algumas ações permitem a recuperação por meio da pasta Lixeira , enquanto outras não. Para restaurar arquivos confirmados anteriormente e enviados por push para um branch remoto, use o histórico de confirmação do Git do repositório remoto:

Ação O arquivo é recuperável?
Excluir arquivo com o navegador do workspace Sim, da caixa Lixeira
Descartar um novo arquivo com a caixa de diálogo da pasta Git Sim, da caixa Lixeira
Descartar um arquivo modificado com a caixa de diálogo da pasta Git Não, o arquivo sumiu
reset (difícil) para as modificações de arquivo não confirmadas Não, as modificações de arquivo desapareceram
reset (difícil) para os arquivos não confirmados e recém-criados Não, as modificações de arquivo desapareceram
Alternar os branches com a caixa de diálogo da pasta do Git Sim, do repositório Git remoto
Outras operações do Git, como confirmação ou push, da caixa de diálogo da pasta do Git Sim, do repositório Git remoto
PATCH atualizações de operações /repos/id da API do Repos Sim, do repositório Git remoto

Obter ajuda

Se nenhuma das diretrizes nesta página resolver seu problema, contate Azure Databricks suporte. Ao entrar em contato com o suporte, inclua o seguinte:

  • A mensagem de erro exata
  • O nome do seu provedor Git e se o repositório é público ou privado
  • Se o problema afeta todos os usuários ou apenas alguns usuários em seu workspace
  • As etapas que você já tentou