Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это важно
Эта функция доступна в бета-версии. Администраторы рабочей области могут управлять доступом к этой функции на странице "Предварительные версии ". См. статью "Управление предварительными версиями Azure Databricks".
В этой статье описаны бессерверные вычислительные ресурсы GPU в Databricks и рекомендуемые варианты использования, рекомендации по настройке вычислительных ресурсов GPU и ограничений функций.
Что такое бессерверные вычисления GPU?
Бессерверные вычислительные ресурсы GPU являются частью бессерверного предложения вычислений. Бессерверные вычисления GPU специализированы для пользовательских рабочих нагрузок глубокого обучения с несколькими узлами. Вы можете использовать бессерверные вычислительные ресурсы GPU для обучения и точной настройки пользовательских моделей с помощью любимых платформ и получения высокого уровня эффективности, производительности и качества.
Бессерверные вычислительные ресурсы GPU включают:
- Интегрированный интерфейс для записных книжек, каталога Unity и MLflow: Вы можете интерактивно разрабатывать код с помощью записных книжек.
- Ускорители GPU:A10 GPU предназначены для ускорения небольших и средних рабочих нагрузок машинного обучения и глубокого обучения, включая классические модели машинного обучения и более мелкие языковые модели. A10s хорошо подходят для задач с умеренными вычислительными требованиями.
- Поддержка нескольких GPU и нескольких узлов: Вы можете запускать распределенные рабочие нагрузки обучения с несколькими GPU и несколькими узлами с помощью API Python без сервера. См. раздел "Распределенное обучение".
Предварительно установленные пакеты для бессерверных вычислений GPU не являются заменой машинного обучения среды выполнения Databricks. Хотя существуют общие пакеты, не все зависимости и библиотеки Databricks Runtime ML поддерживаются в бессерверной вычислительной среде на GPU.
Среды Python в бессерверных вычислениях GPU
Databricks предоставляет две управляемые среды для обслуживания различных вариантов использования.
Замечание
Базовые среды рабочей области не поддерживаются для бессерверных вычислений GPU. Вместо этого используйте среду по умолчанию или ИИ и укажите дополнительные зависимости непосредственно на боковой панели сред или pip install в них.
Базовая среда по умолчанию
Это обеспечивает минимальную среду с стабильным клиентским API для обеспечения совместимости приложений. Устанавливаются только необходимые пакеты Python. Это позволяет Databricks независимо обновлять сервер, обеспечивая улучшения производительности, улучшения безопасности и исправления ошибок без каких-либо изменений кода в рабочих нагрузках. Это среда по умолчанию при выборе бессерверных вычислений GPU. Выберите эту среду, если вы хотите полностью настроить среду для обучения.
Дополнительные сведения о версиях пакетов, установленных в различных версиях ПО, см. в примечаниях к выпуску.
Среда ИИ
Среда ИИ Databricks доступна в бессерверной среде GPU 4. Среда ИИ основана на базовой среде по умолчанию с общими пакетами среды выполнения и пакетами, характерными для машинного обучения на GPU. Он содержит популярные библиотеки машинного обучения, в том числе PyTorch, LangChain, Преобразователи, Ray и XGBoost для обучения и вывода моделей. Выберите эту среду для выполнения рабочих нагрузок обучения.
Дополнительные сведения о версиях пакетов, установленных в различных версиях ПО, см. в примечаниях к выпуску.
Рекомендуемые варианты использования
Databricks рекомендует бессерверные вычисления на видеокартах для любого варианта использования обучения моделей, который требует настройки обучения и видеокарт.
Рассмотрим пример.
- Настройка LLM
- Компьютерное зрение
- системы рекомендаций.
- Обучение с подкреплением
- Прогнозирование временных рядов на основе глубокого обучения
Требования
- Рабочая область в одном из следующих регионов, поддерживаемых Azure:
eastuseastus2centralusnorthcentraluswestcentraluswestus
Настройка бессерверных вычислений GPU
Чтобы подключить записную книжку к бессерверным вычислениям GPU и настроить среду:
- В записной книжке вверху страницы щелкните раскрывающееся меню Подключиться и выберите Serverless GPU.
- Щелкните
чтобы открыть боковую панель среды .
- Выберите A10 из поля Ускоритель.
- Выберите "Нет " для среды по умолчанию или ИИ версии 4 для среды ИИ в поле "Базовая среда ".
- Если вы выбрали "Нет" в поле "Базовая среда ", выберите версию среды.
- Нажмите кнопку "Применить ", а затем подтвердите , что вы хотите применить бессерверные вычисления GPU к вашей среде записной книжки.
Замечание
Подключение к вычислительным ресурсам автоматически завершается через 60 минут бездействия.
Добавление библиотек в среду
Дополнительные библиотеки можно установить в бессерверную вычислительную среду GPU. См. статью "Добавление зависимостей в записную книжку".
Замечание
Добавление зависимостей с помощью панели "Среды" , как показано в разделе "Добавление зависимостей" в записную книжку , не поддерживается для запланированных заданий вычислений GPU без сервера.
Создание и планирование задания
Ниже показано, как создавать и планировать задания для бессерверных вычислительных рабочих нагрузок GPU. Дополнительные сведения см. в статье "Создание запланированных заданий записной книжки и управление ими ".
После открытия записной книжки, которую вы хотите использовать:
- Нажмите кнопку "Расписание " в правом верхнем углу.
- Выберите "Добавить расписание".
- Заполните форму нового расписанияименем задания, расписанием и вычислением.
- Нажмите кнопку "Создать".
Вы также можете создавать и планировать задания из пользовательского интерфейса заданий и конвейеров . Пошаговые инструкции см. в статье "Создание задания ".
Распределенное обучение
См. раздел "Распределенное обучение".
Ограничения
- Бессерверные вычисления GPU поддерживают только акселераторы A10.
- Приватная ссылка не поддерживается. Хранилище или репозитории pip, расположенные за Private Link, не поддерживаются.
- Бессерверные вычисления GPU не поддерживаются для рабочих областей профилей безопасности соответствия требованиям (например, HIPAA или PCI). В настоящее время обработка регулируемых данных не поддерживается.
- Для запланированных заданий на вычислительных ресурсах GPU без сервера автоматическое восстановление несовместимых версий пакетов, связанных с записной книжкой, не поддерживается.
- Максимальное время выполнения рабочей нагрузки составляет семь дней. Для заданий обучения модели, превышающих это ограничение, создайте контрольные точки и перезапустите задание после достижения максимального времени выполнения.
Загрузка данных
См. раздел Загрузка данных на бессерверные GPU.
Лучшие практики
Ознакомьтесь с рекомендациями по вычислению бессерверного GPU.
Устранение неполадок с бессерверными вычислительными процессорами GPU
Если возникают проблемы с выполнением рабочих нагрузок на вычислительных ресурсах GPU без сервера, см. руководство по устранению распространенных проблем, обходных решений и ресурсов поддержки.
Примеры записных книжек
Ниже приведены различные примеры блокнотов, демонстрирующие использование бессерверных вычислений на GPU для различных задач.
| Задача | Description |
|---|---|
| Крупные языковые модели (LLM) | Примеры для точной настройки больших языковых моделей, включая эффективные методы, такие как Low-Rank адаптация (LoRA) и защищенные подходы к точной настройке. |
| Компьютерное зрение | Примеры задач компьютерного зрения, включая обнаружение объектов и классификацию изображений. |
| Системы рекомендаций на основе глубокого обучения | Примеры создания систем рекомендаций с использованием современных подходов глубокого обучения, таких как две башни моделей. |
| Классическое машинное обучение | Примеры для традиционных задач машинного обучения, включая обучение моделей XGBoost и прогнозирование временных рядов. |
| Распределенное обучение с несколькими GPU и несколькими узлами | Примеры масштабирования обучения на нескольких GPU и узлах с помощью бессерверного API GPU, включая распределённую тонкую настройку. |
Примеры обучения с несколькими GPU
Смотрите Распределенное обучение с несколькими GPU и узлами для примеров, показывающих, как использовать различные библиотеки для распределенного обучения с несколькими GPU.