Понимание бизнес-проблемы
Представьте, что вы инженер машинного обучения в компании Proseware, молодом стартапе, работающий над новым приложением для здравоохранения. Модель классификации диабета, созданная специалистами по обработке и анализу данных, является первой моделью для интеграции с приложением. После обсуждения с более крупной командой выясняется, что цель состоит в том, чтобы с веб-приложением необходимо интегрировать несколько моделей.
После подтверждения успешности модели классификации диабета компания Proseware хочет добавить больше моделей машинного обучения, чтобы практикующие врачи могли быстрее диагностировать различные заболевания у пациентов. Для каждой новой модели команда по обработке и анализу данных должна иметь возможность экспериментировать в безопасной среде. После того как новая модель достаточно точна для интеграции с веб-приложением, ее следует протестировать перед развертыванием в конечной точке, которая будет вызываться из веб-приложения.
Вместе с командой вы решили, что лучше всего использовать разные среды:
- Разработка для экспериментирования.
- Промежуточное тестирование .
- Продакшн для развертывания модели в конечной рабочей точке.
Для каждой среды вы создаете отдельную рабочую область Машинного обучения Azure. Используя отдельные рабочие области для каждой среды, вы сможете защитить данные и ресурсы. Например, рабочая область для разработки не будет содержать персональные данные пациентов. Кроме того, специалисты по обработке и анализу данных будут иметь доступ только к рабочей области разработки, поскольку им требуется только среда для экспериментирования и не требуется доступ ни к одному из рабочих ресурсов или коду.
Как инженеру машинного обучения, вам необходимо убедиться, что независимо от того, что создают специалисты по обработке и анализу данных, это можно будет с легкостью перемещать между средами. Когда новая модель будет готова к развертыванию, вы хотите обучить и протестировать ее в промежуточной среде. После тестирования кода, модели и развертывания необходимо развернуть модель в рабочей среде. Части этого процесса можно автоматизировать для ускорения процесса.
Для работы со средами вам потребуется:
- Создайте среды в репозитории GitHub.
- Сохраните учетные данные для каждой рабочей области Azure Machine Learning в качестве секрета среды в GitHub.
- Добавьте необходимых рецензентов в среды для поэтапного утверждения.
- Использовать среды в рабочих процессах GitHub Actions.