Implementar modelos de machine learning no AKS com o Kubeflow

Armazenamento de Blobs
Container Registry
Kubernetes Service

Ideias de solução

Este artigo é uma ideia de solução. Se quiser que expandamos o conteúdo com mais informações, como potenciais casos de utilização, serviços alternativos, considerações de implementação ou orientação de preços, informe-nos ao fornecer feedback do GitHub.

Este artigo apresenta uma solução para a inferência em tempo real no Azure Kubernetes Service (AKS).

Arquitetura

Diagrama de arquitetura que mostra como os modelos de machine learning são implementados no Azure Kubernetes Services (AKS).

Transfira um ficheiro do Visio desta arquitetura.

Fluxo de dados

  1. Um modelo de machine learning é empacotado num contentor e publicado no Azure Container Registry.
  2. Armazenamento de Blobs do Azure aloja conjuntos de dados de preparação e o modelo preparado.
  3. O Kubeflow é utilizado para implementar tarefas de preparação no AKS, incluindo servidores de parâmetros e nós de trabalho.
  4. O Kubeflow é utilizado para disponibilizar um modelo de produção. Este passo promove um ambiente consistente entre testes, controlo e produção.
  5. O AKS suporta VMs ativadas para GPU.
  6. Os programadores criam funcionalidades para consultar o modelo que é executado num cluster do AKS.

Componentes

  • O Armazenamento de Blobs é um serviço que faz parte do Armazenamento do Azure. O Armazenamento de Blobs oferece armazenamento de objetos na cloud otimizado para grandes quantidades de dados não estruturados.
  • O Container Registry compila, armazena e gere imagens de contentor e pode armazenar modelos de machine learning em contentores.
  • O AKS é um serviço kubernetes altamente disponível, seguro e totalmente gerido. O AKS facilita a implementação e gestão de aplicações em contentores.
  • O Machine Learning é um ambiente baseado na cloud que pode utilizar para preparar, implementar, automatizar, gerir e controlar modelos de machine learning. Pode utilizar os modelos para prever comportamentos, resultados e tendências futuros.

Detalhes do cenário

O AKS é útil quando precisa de implementações de produção de alta escala dos seus modelos de machine learning. Uma implementação de grande escala envolve um tempo de resposta rápido, dimensionamento automático do serviço implementado e registo. Para obter mais informações, veja Implementar um modelo num cluster de Azure Kubernetes Service.

Esta solução utiliza o Kubeflow para gerir a implementação no AKS. Os modelos de machine learning são executados em clusters do AKS que são apoiados por máquinas virtuais (VMs) compatíveis com GPU.

Potenciais casos de utilização

Esta solução aplica-se a cenários que utilizam VMs compatíveis com AKS e GPU para machine learning. Os exemplos incluem:

  • Sistemas de classificação de imagens.
  • Algoritmos de processamento de linguagem natural.
  • Sistemas de manutenção preditiva.

Passos seguintes