Поделиться через


Ошибки и устранение неполадок для папок Databricks Git

Следуйте приведенным ниже инструкциям, чтобы ответить на распространенные сообщения об ошибках или устранить неполадки с папками Databricks Git.

Invalid credentials

Попробуйте сделать следующее.

  • Убедитесь, что параметры интеграции Git (параметры>связанные учетные записи) верны.

    • Вы должны ввести и имя пользователя, и токен поставщика Git.
  • Убедитесь, что вы выбрали правильного поставщика Git в настройках>связанных учетных записей.

  • Убедитесь, что личный маркер доступа или пароль приложения имеют правильный доступ к репозиторию.

  • Если в вашем поставщике Git включен единый вход, разрешите использование своих токенов для единого входа.

  • Протестируйте токен с помощью командной строки Git. Замените текстовые строки в угловых скобках:

    git clone https://<username>:<personal-access-token>@github.com/<org>/<repo-name>.git
    

Secure connection...SSL problems

Эта ошибка возникает, если сервер Git недоступен из Azure Databricks. Чтобы получить доступ к частному серверу Git, обратитесь к группе учетной записи Azure Databricks

<link>: Secure connection to <link> could not be established because of SSL problems

Ошибка учетных данных идентификатора Microsoft Entra

Encountered an error with your <ms-entra-id> credentials. Please try logging out of <ms-entra-id> and logging back in.

Эта ошибка может возникать, если ваша команда недавно переехала на использование политики многофакторной проверки подлинности (MFA) для . Чтобы устранить эту проблему, необходимо выйти из Microsoft Entra ID, перейдя к portal.azure.com и выйдя из системы. При повторном входе в систему вам будет предложено использовать MFA (многофакторную аутентификацию).

Если это не поможет, попробуйте полностью выйти из всех служб Azure, прежде чем пытаться снова войти.

Ошибки, связанные с истечением времени ожидания

Дорогостоящие операции, такие как клонирование большого репозитория или проверка большой ветви, могут привести к ошибкам времени ожидания, но операция может завершиться в фоновом режиме. Вы также можете повторить попытку позже, если рабочая область была сильно загружена во время выполнения операции.

Чтобы работать с большим репозиторием, попробуйте sparse checkout.

Ошибки 404

Если при попытке открыть файл, отличный от записной книжки, возникает ошибка 404, попробуйте ждать несколько минут, а затем повторите попытку. Между включением рабочей области и использованием веб-приложением флага конфигурации существует задержка в несколько минут.

Отсоединяемое состояние головы

Папка Databricks Git может перейти в состояние "отсоединённая голова", если:

  • Удаленная ветвь удалена. Databricks попытался восстановить незафиксированные локальные изменения в ветви, применяя эти изменения к ветке по умолчанию. Если в ветви по умолчанию есть конфликтующие изменения, Databricks применяет изменения на моментальном снимке этой ветви (отсоединенная голова).
  • Пользователь или субъект-служба извлек удаленный репозиторий в теге update repo с помощью API.

Чтобы восстановить это состояние, выполните указанные ниже действия.

  1. Нажмите кнопку create branch, чтобы создать новую ветвь на основе текущего коммита, или используйте раскрывающийся список "Выбрать ветвь", чтобы переключиться на существующую ветвь.
  2. Зафиксируйте и отправьте, если вы хотите сохранить изменения. Чтобы отменить изменения, щелкните кебаб в разделе "Изменения".

Устранение конфликтов имен записных книжек

Разные записные книжки с одинаковыми или похожими именами файлов могут привести к ошибке при создании репозитория или пул-реквеста, например, Cannot perform Git operation due to conflicting names или A folder cannot contain a notebook with the same name as a notebook, file, or folder (excluding file extensions).

Конфликт именования может возникать даже с различными расширениями файлов. Например, эти два файла конфликтуют:

  • notebook.ipynb
  • notebook.py

Диаграмма: конфликт имен для записной книжки, файла или папки.

Устранение конфликта имен

  • Переименуйте записную книжку, файл или папку, приводящие к ошибочному состоянию.
    • Если эта ошибка возникает при клонировании репозитория, необходимо переименовать записные книжки, файлы или папки в удаленном репозитории Git.

Ошибки свидетельствуют о необходимости повторного клонирования

There was a problem with deleting folders. The repo could be in an inconsistent state and re-cloning is recommended.

Эта ошибка указывает на то, что при удалении папок из репозитория произошла ошибка. Это может оставить репозиторий в несогласованном состоянии, где папки, которые должны были быть удалены, по-прежнему существуют. Если эта ошибка возникает, Databricks рекомендует удалить и повторно клонировать репозиторий, чтобы сбросить его состояние.

No experiment...found или ошибки пользовательского интерфейса MLflow

Вы можете столкнуться с сообщением об ошибке Azure Databricks No experiment for node found или с ошибкой в MLflow при работе с экспериментом в записной книжке MLflow, последний раз записанным в журнал до выпуска платформы 3.72. Чтобы устранить эту ошибку, регистрируйте новый запуск в записной книжке, связанной с этим экспериментом.

Примечание.

Это относится только к экспериментам в записных книжках. Создание новых экспериментов в папках Git не поддерживается.

Записные книжки отображаются как модифицированные без каких-либо явных редактирований пользователей.

Если каждая строка в записной книжке кажется изменённой без редактирования пользователем, изменения могут касаться символов конца строки. Databricks использует символы перевода строки LF в стиле Linux, и это может отличаться от переводов строк в файлах, созданных в системах Windows.

Если ваша записная книжка отображается как измененная, но вы не видите явных изменений, возможно, "изменения" связаны с обычно невидимыми символами конца строки. Конечные символы могут отличаться между операционными системами и форматами файлов.

Чтобы диагностировать эту проблему, проверьте, есть ли у вас файл .gitattributes. Если вы сделаете:

  • Он не должен содержать * text eol=crlf.
  • Если вы не используете Windows в качестве операционной системы, удалите данную настройку. В вашей собственной среде разработки и Databricks используются символы конца строки Linux.
  • Если вы используете Windows, измените параметр * text=autoна . Теперь Git будет хранить все файлы с окончаниями строк в стиле Linux, но при извлечении автоматически преобразовывать их в символы конца строки, специфичные для платформы, например, Windows.

Если вы уже зафиксировали файлы с символами конца строки Windows в Git, выполните следующие действия.

  1. Снимите все невыполненные изменения.
  2. Обновите файл .gitattributes с помощью приведенной выше рекомендации. Зафиксируйте изменения.
  3. Запустите git add --renormalize. Зафиксируйте и отправьте все изменения.