Бөлісу құралы:


Развертывание приложения Databricks

После создания и разработки приложения Azure Databricks разверните его, чтобы сделать его доступным в рабочей области Azure Databricks. Развертывание создает приложение, устанавливает зависимости и запускает его с помощью конфигурации, определенной в файлах проекта. Вы можете развертывать приложения с помощью пользовательского интерфейса Azure Databricks или интерфейса командной строки Databricks.

Замечание

Если вы создаете приложение из шаблона, Azure Databricks развертывает его автоматически при первом создании. Однако его можно повторно развернуть позже после внесения изменений. См. статью "Создание приложения Databricks" из шаблона.

Логика развертывания

Databricks Apps поддерживает развертывание приложений, использующих Python, Node.jsили сочетание обоих. Это позволяет использовать гибкие архитектуры, например интерфейс Node.js с серверной частью Python.

Во время развертывания процесс сборки проверяет наличие package.json файла в корневом каталоге приложения, чтобы определить, используется ли Node.js. Если он присутствует, он включает шаги сборки, относящиеся к узлам, наряду с шагами Python. Логика развертывания соответствует следующему шаблону:

Если package.json присутствует:

  1. Запуск npm install
  2. Запустите pip install -r requirements.txt (если он существует)
  3. Запустите npm run build, если скрипт build задан в package.json.
  4. Выполните команду, указанную в app.yaml, или npm run start если команда не указана.

Замечание

Если в app.yaml не указана команда, Azure Databricks выполняет npm run start, даже если приложение содержит код на Python. Чтобы запустить процессы Python и Node.js, определите пользовательский start скрипт, использующий инструмент, такой как concurrently, чтобы запустить оба. Например: concurrently "npm run start:node" "python my_app.py".

Если package.json нет:

  1. Запустите pip install -r requirements.txt (если он существует)
  2. Выполните команду, указанную в app.yaml, или python <my-app>.py если команда не указана.

Подготовка к развертыванию

Перед развертыванием приложения убедитесь, что проект включает необходимые компоненты:

Кроме того, убедитесь, что служебный принципал приложения имеет доступ к папке с исходным кодом.

Выбор источника развертывания

Вы можете развернуть приложения Databricks из следующих источников:

  • Папка рабочей области — отправка файлов приложения в папку рабочей области и развертывание из нее. Это стандартный метод развертывания.
  • Репозиторий Git . Настройка репозитория Git для приложения и развертывание непосредственно без отправки файлов в рабочую область. Приложение читает код из настроенного Git-референса (ветвь, тег или коммит) при каждом развертывании. Поддерживаются все основные поставщики Git, включая GitHub, GitLab и Bitbucket. Полный список поддерживаемых поставщиков см. в разделе "Подключение поставщика Git к Databricks".

Вы можете переключаться между рабочей областью и источниками Git для одного приложения в любое время.

Развертывание приложения

В следующих разделах описывается развертывание из папки рабочей области или непосредственно из репозитория Git.

Развертывание из папки рабочей области

Пользовательский интерфейс Databricks

Чтобы развернуть приложение из пользовательского интерфейса Azure Databricks, выполните следующие действия.

  1. Отправьте файлы приложения в рабочую область Azure Databricks. Инструкции см. в разделе "Импорт файла".
  2. Щелкните "Значок вычисленийВычисления" на боковой панели.
  3. Перейдите на вкладку "Приложения" и щелкните ссылку на приложение в столбце "Имя ".
  4. Щелкните «Развернуть» и выберите папку в рабочей области, в которую вы загрузили файлы приложения.
  5. Нажмите кнопку "Выбрать", а затем "Развернуть".
  6. Просмотрите конфигурацию и нажмите кнопку "Развернуть".

Databricks CLI (интерфейс командной строки)

Чтобы развернуть приложение с помощью интерфейса командной строки, выполните следующие действия.

  1. Откройте терминал и перейдите в каталог, содержащий файлы приложения.

  2. Отправьте файлы приложения в рабочую область Azure Databricks с помощью sync команды. Замените путь расположением рабочей области, в котором нужно отправить файлы.

    databricks sync --watch . /Workspace/Users/my-email@org.com/my-app
    

    Флаг --watch сохраняет процесс синхронизации и автоматически отправляет изменения при локальном изменении файлов. Чтобы исключить определенные файлы или каталоги из синхронизации, добавьте их .gitignore в файл в локальном каталоге приложений. Распространенные файлы, которые следует исключитьnode_modules/: , .env__pycache__/.DS_Storeи любые большие файлы данных или артефакты сборки.

  3. Проверьте отправку, просмотрев файлы в рабочей области. Щелкните значок рабочей областирабочую область на боковой панели и перейдите к каталогу, созданному для вашего приложения.

  4. Разверните приложение, выполнив следующую команду. Замените имя приложения и путь к исходному коду значениями.

    databricks apps deploy my-app-name \
       --source-code-path /Workspace/Users/my-email@org.com/my-app
    

    Интерфейс командной строки отображает ход развертывания и подтверждает выполнение приложения.

Развертывание из репозитория Git

Это важно

Эта функция доступна в бета-версии. Если администратор отключает функцию, существующие приложения, развернутые из Git, продолжают выполняться, но вы не сможете повторно развернуть или перезапустить их, пока не включите предварительную версию или удалите репозиторий из приложения.

Чтобы развернуть приложение из репозитория Git, добавьте репозиторий на уровне приложения, а затем укажите ссылку на Git при его развертывании. Репозиторий Git должен содержать файлы приложения, включая app.yaml, зависимости и точку входа. Поддерживаются все основные поставщики Git, включая GitHub, GitLab и Bitbucket.

Чтобы настроить и развернуть приложение из Git, выполните приведенные ниже действия.

  1. Отправьте файлы приложения в репозиторий Git.
  2. В рабочей области Azure Databricks щелкните значок вычисленийВычисления в боковой панели.
  3. Перейдите на вкладку "Приложения" и выберите существующее приложение для изменения или нажмите кнопку "Создать приложение".
  4. На шаге настройки репозитория Git введите URL-адрес репозитория Git (например, https://github.com/org/repo) и выберите поставщика Git.
  5. Нажмите кнопку "Создать приложение " или " Сохранить ", чтобы вернуться на страницу сведений о приложении.
  6. Для частных репозиториев сервисный принципал приложения должен иметь настроенные учетные данные для Git. На странице сведений о приложении нажмите кнопку "Настройка учетных данных Git". Кроме того, измените приложение и добавьте учетные данные на шаге настройки репозитория Git . Чтобы добавить учетные данные Git, необходимо иметь разрешения CAN MANAGE на приложение. Инструкции по каждому поставщику см. в разделе "Подключение поставщика Git к Databricks".

Это важно

Для обеспечения безопасности Azure Databricks удаляет все учетные данные Git, связанные с субъектом-службой приложения при изменении источника развертывания (из Git в рабочую область или рабочую область на Git) или при изменении репозитория Git. Изменение только ссылки на Git не удаляет учетные данные. После изменения источника развертывания или репозитория необходимо перенастроить учетные данные Git для повторного развертывания из Git.

Замечание

Создатели приложений автоматически получают CAN MANAGE разрешения на служебный принципал только при включении бета-функции развертывания Git. Если вы создали приложение во время отключения функции, возможно, у вас нет разрешения на добавление учетных данных Git.

Учетные записи служб поддерживают один набор Git-учетных данных для каждого поставщика. Обновление учетных данных, например через консоль учетной записи, заменяет существующие учетные данные для этого поставщика и влияет на все приложения, использующие учетную запись службы с этим поставщиком.

Затем разверните приложение:

  1. На странице сведений о приложении нажмите кнопку "Развернуть".
  2. Выберите из Git.
  3. Для ссылки на Git введите имя ветки, тег или хэш SHA (например, main, v1.0.0, или хэш коммита).
  4. Для типа ссылки укажите, к какому типу относится ссылка, например ветвь, тег или коммит.
  5. Нажмите кнопку "Развернуть".

Для ссылок на ветку или тег Azure Databricks развертывает самый последний коммит из этой ветки или тега. Для ссылок SHA фиксации Azure Databricks всегда развертывает конкретную фиксацию. Если учетные данные Git субъекта-службы недействительны или истекли, развертывание не удается.

Поведение после развертывания

После завершения развертывания Azure Databricks запускает ваше приложение на основе определенного command в файле app.yaml или, по умолчанию, вместо этого запускается python app.py. На странице сведений о приложении отображается текущее состояние и предоставляется доступ к журналам, журналу развертывания и сведениям о среде.

Просмотр страницы сведений о приложении после развертывания приложения

Чтобы просмотреть выходные данные развернутого приложения, щелкните ссылку приложения.

Перейдите на вкладку "Журналы" для отладки и мониторинга среды выполнения. См. статью "Ведение журнала и мониторинг для приложений Databricks".

Обновление или повторное развертывание приложения

Повторно разверните приложение после внесения изменений в исходный код или конфигурацию. Повторное развертывание применяет последние обновления без повторного восстановления приложения. Повторное развертывание можно выполнить из рабочей области или репозитория Git в любое время.

Повторное развертывание из папки в рабочей области

Чтобы переразвернуть папку рабочей области, выполните следующие действия.

  1. Обновите файлы приложения в папке рабочей области.
  2. Выберите приложение и нажмите кнопку "Развернуть".
  3. Если путь к исходному коду изменился или вы переключаетесь с источника Git, щелкните стрелку рядом с Развернуть и выберите Развернуть с использованием другого источника.

Повторное развертывание из репозитория Git

Для повторного развертывания из репозитория Git выполните следующие действия.

  1. Отправьте изменения в репозиторий Git.
  2. В рабочей области Azure Databricks выберите свое приложение и нажмите кнопку "Развернуть".
  3. Если ссылка на Git изменилась или вы переключаетесь с источника рабочей области, щелкните стрелку рядом с развертывание и выберите Развернуть с использованием другого источника.

Чтобы изменить репозиторий или учетные данные Git, измените конфигурацию приложения. Удаление репозитория Git из приложения требует развертывания из рабочей области.

Это важно

Изменение репозитория Git или переключение между источниками развертывания (Git и рабочей средой) удаляет все учетные данные Git для основной службы приложения. Перед развертыванием из Git необходимо перенастроить учетные данные.

Устранение неполадок с развертыванием

Если приложение не удается развернуть или не выполняется должным образом, попробуйте выполнить следующие действия по устранению неполадок:

  • Проверьте журналы для сообщений об ошибках или выходных данных среды выполнения.
  • Проверьте app.yaml синтаксис и параметры.
  • Убедитесь, что секреты и переменные среды в env разделе обрабатываются правильно.
  • Убедитесь, что все необходимые зависимости включены или установлены.

Для развертываний репозитория Git:

  • Для частных репозиториев убедитесь, что принципал службы приложения настроен с учетными данными Git.
  • Проверьте правильность URL-адреса репозитория Git.
  • Убедитесь, что ссылка на Git (ветка, тег или коммит) существует в репозитории.

Дальнейшие шаги