Поделиться через


реестры Машинное обучение для MLOps

В этой статье описывается, как Машинное обучение Azure реестры отделяют ресурсы машинного обучения от рабочих областей, позволяя использовать MLOps в средах разработки, тестирования и рабочей среды. Ваши среды могут отличаться в зависимости от сложности ИТ-систем. Следующие факторы влияют на количество и тип необходимых сред:

  • Политики безопасности и соответствия требованиям. Рабочие среды могут быть изолированы от сред разработки с точки зрения управления доступом, сетевой архитектуры и воздействия данных.
  • Подписки. Среды разработки и рабочие среды часто используют отдельные подписки для выставления счетов, бюджетирования и управления затратами.
  • Регионы. Возможно, вам потребуется развернуть в разных регионах Azure для поддержки требований к задержке и избыточности.

В предыдущих сценариях можно использовать разные рабочие области Машинное обучение Azure для разработки, тестирования и рабочей среды. Эта конфигурация представляет следующие потенциальные проблемы для обучения моделей и развертывания.

  • Возможно, вам потребуется обучить модель в рабочей области разработки, но развернуть ее в конечной точке рабочей области, возможно, в другой подписке или регионе Azure. В этом случае необходимо иметь возможность трассировать задание обучения. Например, при возникновении проблем с точностью или производительностью в рабочем развертывании необходимо проанализировать метрики, журналы, код, среду и данные, используемые для обучения модели.

  • Возможно, потребуется разработать конвейер обучения с тестируемыми данными или анонимными данными в рабочей области разработки, но переобучить модель с рабочими данными в рабочей рабочей области. В этом случае может потребоваться сравнить метрики обучения по образцам и рабочим данным, чтобы оптимизировать обучение с фактическими данными.

Перекрестная рабочая область MLOps с реестрами

Реестр, как репозиторий Git, отделяет ресурсы машинного обучения от рабочих областей и размещает ресурсы в центральном расположении, что делает их доступными для всех рабочих областей в организации.

Чтобы повысить уровень моделей в средах разработки, тестирования и рабочей среды, можно начать с итеративной разработки модели в среде разработки. Если у вас хорошая модель кандидата, ее можно опубликовать в реестре. Затем модель из реестра можно развернуть в конечных точках в разных рабочих областях.

Совет

Если у вас уже есть модели, зарегистрированные в рабочей области, можно повысить уровень моделей в реестр. Вы также можете зарегистрировать модель непосредственно в реестре из выходных данных задания обучения.

Чтобы разработать конвейер в одной рабочей области, а затем запустить его в других рабочих областях, сначала зарегистрируйте компоненты и среды, которые образуют стандартные блоки конвейера. При отправке задания конвейера вычислительные ресурсы и обучающие данные, уникальные для каждой рабочей области, определяют рабочую область для выполнения.

На следующей схеме показано продвижение конвейера обучения между исследовательскими и разработками рабочих областей, а затем обученное повышение уровня модели для тестирования и рабочей среды.

Схема использования конвейера и модели в разных средах.

Следующие шаги