Compartilhar via


Registros do Machine Learning para MLOps

Neste artigo, você aprenderá a dimensionar o MLOps em ambientes de desenvolvimento, teste e produção. Os ambientes podem variar de poucos a muitos de acordo com a complexidade do ambiente de TI e são influenciados por fatores como:

  • Políticas de segurança e conformidade – Os ambientes de produção precisam ser isolados dos ambientes de desenvolvimento em termos de controles de acesso, arquitetura de rede, exposição de dados etc.?
  • Assinaturas – Os ambientes de desenvolvimento em uma assinatura e os ambientes de produção estão em uma assinatura diferente? Muitas vezes, assinaturas separadas são usadas para considerar as finalidades de cobrança, orçamento e gerenciamento de custos.
  • Regiões – Você precisa implantar em diferentes regiões do Azure para dar suporte a requisitos de latência e redundância?

Nesses cenários, você pode usar diferentes workspaces do Azure Machine Learning para desenvolvimento, teste e produção. Essa configuração apresenta os seguintes desafios para treinamento e implantação de modelo:

  • Você precisa treinar um modelo em um workspace de desenvolvimento, mas implantá-lo em um ponto de extremidade em um workspace de produção, possivelmente em uma assinatura ou região diferente do Azure. Nesse caso, você deve rastrear o trabalho de treinamento. Por exemplo, para analisar métricas, logs, códigos, ambientes e dados usados para treinar o modelo, se você encontrar problemas de precisão ou desempenho na implantação de produção.
  • Você precisa desenvolver um pipeline de treinamento com dados de teste ou dados anonimizados no workspace de desenvolvimento, mas treinar novamente o modelo com dados de produção no workspace de produção. Nesse caso, talvez seja necessário comparar as métricas de treinamento em dados de exemplo com os dados de produção, para verificar se as otimizações de treinamento estão funcionando corretamente com os dados reais.

MLOps entre workspaces com registros

Os registros, assim como um repositório Git, separam os ativos de ML dos workspaces e os hospedam em um local central, disponibilizando-os para todos os workspaces em sua organização.

Se você quiser promover modelos entre ambientes (desenvolvimento, teste, produção), comece desenvolvendo iterativamente um modelo no desenvolvimento. Quando você tem um bom modelo de candidato, pode publicá-lo em um registro. Em seguida, você pode implantar o modelo do Registro em pontos de extremidade em diferentes workspaces.

Dica

Se você já tiver modelos registrados em um workspace, poderá promovê-los para um registro. Você também pode registrar um modelo diretamente em um registro da saída de um trabalho de treinamento.

Se você quiser desenvolver um pipeline em um workspace e executá-lo em outros, comece registrando os componentes e ambientes que formam os blocos de construção do pipeline. Quando você envia o trabalho de pipeline, o workspace em que ele é executado é selecionado pelos dados de computação e de treinamento, que são exclusivos para cada workspace.

O diagrama a seguir ilustra a promoção de pipelines entre workspaces exploratórios e de desenvolvimento e, em seguida, a promoção de modelos entre desenvolvimento, teste e produção.

Diagrama de uso de pipeline e modelo entre ambientes.

Próximas etapas