Поделиться через


Открытый исходный код и управляемый MLflow в Azure Databricks

Эта страница предназначена для того, чтобы пользователи MLflow с открытым кодом знакомы с использованием MLflow в Databricks. Управляемый Databricks MLflow использует одни и те же API, но предоставляет дополнительные возможности с помощью интеграции с более широкой платформой Azure Databricks.

Преимущества управляемого MLflow в Azure Databricks

MLflow с открытым кодом предоставляет базовую модель данных, API и пакет SDK. Это означает, что данные и рабочие нагрузки всегда переносятся.

Управляемый MLflow в Databricks добавляет:

  • Корпоративное управление и безопасность благодаря интеграции с платформой Databricks, Lakehouse и каталогом Unity. Данные ИИ и машинное обучение, инструменты, агенты, модели и другие ресурсы можно управлять и использовать на той же платформе, что и остальные ваши данные и рабочие нагрузки.
  • Полностью управляемое размещение на серверах, подготовленных к работе, с возможностью масштабирования
  • Интеграции для разработки и производства с более широкой платформой Mosaic AI

Дополнительные сведения о преимуществах см. на странице продукта Managed MLflow и см. на остальной части этой страницы, чтобы узнать о технических деталях.

Подсказка

Ваши данные всегда являются вашими . Базовая модель данных и API полностью открыты. Вы можете экспортировать и использовать данные MLflow в любом месте.

Дополнительные возможности Databricks

В этом разделе перечислены важные возможности, включенные в управляемый MLflow через интеграцию с более широкой платформой Azure Databricks. Общие сведения обо всех возможностях MLflow для GenAI см. в документации по MLflow 3 для GenAI и документации по GenAI с открытым кодом.

Управление и безопасность корпоративного уровня

  • Управление предприятиями с помощью каталога Unity: модели, таблицы компонентов, векторные индексы, инструменты и многое другое управляются централизованно в каталоге Unity. При развертывании агентов проверка подлинности агента, данных и инструментов может быть точно контролируема с помощью сквозной проверки подлинности и проверки подлинности от имени пользователя.
  • Интеграция данных Lakehouse: использование пространств ИИ/BI Genie и панелей мониторинга и Databricks SQL для анализа журналов и трассировок из экспериментов MLflow.
  • Безопасность и управление: разрешения MLflow соответствуют тем же шаблонам управления, что и более широкая платформа Databricks:
  • Аудит. Системные таблицы предоставляют журналы использования и аудита для управляемого MLflow.

Полностью управляемое размещение на рабочих серверах

  • Полностью управляемый: Azure Databricks предоставляет серверы MLflow с автоматическими обновлениями, предназначенными для масштабируемости и рабочей среды. Дополнительные сведения см. в разделе "Ограничения ресурсов".
  • Надежная платформа: Управляемый MLflow используется тысячами клиентов по всему миру.

Интеграция для разработки и рабочей среды

Разработка искусственного интеллекта и машинного обучения упрощается интеграцией, например:

Производственные ИИ и машинное обучение упрощаются такими интеграциями, как:

Замечание

Коллекция телеметрии с открытым кодом была представлена в MLflow 3.2.0 и отключена по умолчанию в Databricks. Дополнительные сведения см. в документации по отслеживанию использования MLflow.

Дальнейшие шаги

Начало работы с MLflow в Databricks:

Связанные справочные материалы: