Compreender o problema do negócio
Imagine que você é um engenheiro de aprendizado de máquina na Proseware, uma jovem start-up trabalhando em um novo aplicativo de cuidados de saúde. O modelo de classificação da diabetes, criado pelos cientistas de dados, é o primeiro modelo a ser integrado com a aplicação. Depois de falar com a equipa maior, verifica-se que o objetivo é ter vários modelos integrados com a aplicação web.
Quando o modelo de classificação da diabetes se revelar bem-sucedido, a Proseware quer adicionar mais modelos de aprendizagem automática, para que os profissionais possam diagnosticar mais rapidamente os pacientes para várias doenças. Para cada novo modelo, a equipe de ciência de dados precisará ser capaz de experimentar em um ambiente seguro. Quando o novo modelo for preciso o suficiente para ser integrado ao aplicativo Web, ele deverá ser testado antes de implantá-lo em um ponto de extremidade que será chamado a partir do aplicativo Web.
Junto com a equipe, você decide que é melhor usar diferentes ambientes:
- Desenvolvimento para experimentação.
- Preparação para testes.
- Produção para implantação do modelo no endpoint de produção.
Para cada ambiente, você criará um espaço de trabalho separado do Azure Machine Learning. Ao manter os espaços de trabalho separados para cada ambiente, você poderá proteger dados e recursos. Por exemplo, o espaço de trabalho de desenvolvimento não conterá dados pessoais de pacientes. E os cientistas de dados só terão acesso ao espaço de trabalho de desenvolvimento, pois só precisam de um ambiente para experimentação e não precisam de acesso a nenhum código ou recursos de produção.
Como engenheiro de aprendizado de máquina, você precisa garantir que tudo o que os cientistas de dados criarem, será facilmente movido entre ambientes. Quando um novo modelo estiver pronto para ser implantado, você deseja que o modelo seja treinado e testado no ambiente de preparação. Depois de testar o código, o modelo e a implantação, você deseja implantar o modelo no ambiente de produção. Partes deste processo podem ser automatizadas para acelerar o processo.
Para trabalhar com ambientes, você vai querer:
- Crie ambientes em seu repositório GitHub.
- Armazene credenciais para cada espaço de trabalho do Azure Machine Learning como um segredo de ambiente no GitHub.
- Adicione os revisores necessários aos ambientes para aprovação fechada.
- Use ambientes em seus fluxos de trabalho do GitHub Actions.