Partilhar via


Registros de aprendizado de máquina para MLOps

Este artigo descreve como os registros do Azure Machine Learning separam ativos de aprendizado de máquina de espaços de trabalho, permitindo que você use MLOps em ambientes de desenvolvimento, teste e produção. Seus ambientes podem variar com base na complexidade de seus sistemas de TI. Os seguintes fatores influenciam o número e o tipo de ambientes necessários:

  • Políticas de segurança e conformidade. Os ambientes de produção podem precisar ser isolados dos ambientes de desenvolvimento em termos de controles de acesso, arquitetura de rede e exposição de dados.
  • Subscrições. Os ambientes de desenvolvimento e os ambientes de produção geralmente usam assinaturas separadas para fins de faturamento, orçamento e gerenciamento de custos.
  • Regiões. Talvez seja necessário implantar em diferentes regiões do Azure para dar suporte aos requisitos de latência e redundância.

Nos cenários anteriores, você pode usar diferentes espaços de trabalho do Azure Machine Learning para desenvolvimento, teste e produção. Essa configuração apresenta os seguintes desafios potenciais para treinamento e implantação de modelos:

  • Talvez seja necessário treinar um modelo em um espaço de trabalho de desenvolvimento, mas implantá-lo em um ponto de extremidade em um espaço de trabalho de produção, possivelmente em uma assinatura ou região diferente do Azure. Neste caso, deve ser capaz de rastrear o trabalho de formação. Por exemplo, se você encontrar problemas de precisão ou desempenho com a implantação de produção, precisará analisar as métricas, logs, código, ambiente e dados usados para treinar o modelo.

  • Talvez seja necessário desenvolver um pipeline de treinamento com dados de teste ou dados anonimizados no espaço de trabalho de desenvolvimento, mas treinar novamente o modelo com dados de produção no espaço de trabalho de produção. Nesse caso, talvez seja necessário comparar as métricas de treinamento em dados de amostra versus dados de produção para garantir que as otimizações de treinamento tenham um bom desempenho com os dados reais.

MLOps entre espaços de trabalho com registos

Um registro, muito parecido com um repositório Git, separa ativos de aprendizado de máquina de espaços de trabalho e hospeda os ativos em um local central, tornando-os disponíveis para todos os espaços de trabalho em sua organização. Você pode usar registros para armazenar e compartilhar ativos, como modelos, ambientes, componentes e conjuntos de dados.

Para promover modelos em ambientes de desenvolvimento, teste e produção, você pode começar desenvolvendo iterativamente um modelo no ambiente de desenvolvimento. Quando você tem um bom modelo candidato, você pode publicá-lo em um registro. Em seguida, você pode implantar o modelo do Registro em pontos de extremidade em espaços de trabalho diferentes.

Gorjeta

Se você já tiver modelos registrados em um espaço de trabalho, poderá promovê-los para um registro. Você também pode registrar um modelo diretamente em um registro a partir da saída de um trabalho de treinamento.

Para desenvolver um pipeline em um espaço de trabalho e, em seguida, executá-lo em outros espaços de trabalho, comece registrando os componentes e ambientes que formam os blocos de construção do pipeline. Quando você envia o trabalho de pipeline, a computação e os dados de treinamento, que são exclusivos para cada espaço de trabalho, determinam o espaço de trabalho no qual ele será executado.

O diagrama a seguir mostra a promoção do pipeline de treinamento entre espaços de trabalho exploratórios e de desenvolvimento e, em seguida, a promoção do modelo treinado para teste e produção.

Diagrama de uso de pipeline e modelo em todos os ambientes.

Próximos passos