Share via


Perfis de carga de trabalho em Aplicativos de Contêiner do Azure

Um perfil de carga de trabalho determina a quantidade de recursos de computação e memória disponíveis para os aplicativos de contêiner implantados em um ambiente.

Os perfis são configurados para atender às diferentes necessidades de seus aplicativos.

Tipo de perfil Descrição Uso potencial
Consumo Adicionado automaticamente a qualquer novo ambiente. Aplicativos que não exigem requisitos de hardware específicos
Dedicado (Uso geral) Equilíbrio de memória e recursos computacionais Aplicativos que exigem maiores quantidades de CPU e/ou memória
Dedicado (Memória otimizada) Aumento dos recursos de memória Aplicativos que precisam de acesso a grandes dados na memória, modelos de aprendizado de máquina na memória ou outros requisitos de memória elevados
Dedicado (habilitado para GPU) (visualização) GPU habilitada com mais memória e recursos de computação disponíveis nas regiões Oeste dos EUA 3 e Norte da Europa. Aplicativos que exigem GPU

Observação

Ao usar perfis de carga de trabalho habilitados para GPU, certifique-se de que o aplicativo esteja executando a versão mais recente do CUDA.

O perfil de carga de trabalho de Consumo é o perfil padrão adicionado a cada tipo de perfil de ambiente de área de trabalho. Você pode adicionar perfis de carga de trabalho dedicados ao seu ambiente à medida que cria um ambiente ou depois que ele é criado. Os ambientes de perfis de carga de trabalho são implantados separadamente dos ambientes somente consumo.

Para cada perfil de carga de trabalho dedicada em seu ambiente, você pode:

  • Selecionar o tipo e o tamanho
  • Implantar vários aplicativos no perfil
  • Usar o dimensionamento automático para adicionar e remover instâncias com base nas necessidades dos aplicativos
  • Limitar o dimensionamento do perfil para controlar melhor os custos

Você pode configurar cada um dos seus aplicativos para ser executado em qualquer um dos perfis de carga de trabalho definidos em seu ambiente de Aplicativos de Contêiner. Essa configuração é ideal para implantar microsserviços em que cada aplicativo pode ser executado na infraestrutura de computação apropriada.

Observação

Você só pode aplicar um perfil de carga de trabalho de GPU a um ambiente à medida que o ambiente é criado.

Tipos de perfil

Há diferentes tipos e tamanhos de perfis de carga de trabalho disponíveis por região. Por padrão, cada plano Dedicado inclui um perfil de consumo, mas você também pode adicionar qualquer um dos seguintes perfis:

Nome de exibição Nome vCPU Memória (GiB) GPU Categoria Alocação
Consumo Consumo 4 8 - Consumo por réplica
Dedicado-D4 D4 4 16 - Propósito geral por nó
Dedicado-D8 D8 8 32 - Propósito geral por nó
Dedicado-D16 D16 16 64 - Propósito geral por nó
Dedicado-D32 D32 32 128 - Propósito geral por nó
Dedicado-D4 E4 4 32 - Memória otimizada por nó
Dedicado-D8 E8 8 64 - Memória otimizada por nó
Dedicado-E16 E16 16 128 - Memória otimizada por nó
Dedicado-E32 E32 32 256 - Memória otimizada por nó
Dedicado-NC24-A100 (visualização) NC24-A100 24 220 1 Habilitado para GPU por nó*
Dedicado-NC48-A100 (visualização) NC48-A100 48 440 2 Habilitado para GPU por nó*
Dedicado-NC96-A100 (visualização) NC96-A100 96 880 4 Habilitado para GPU por nó*

* A capacidade é alocada caso a caso. Envie um tíquete de suporte para solicitar a quantidade de capacidade necessária para sua inscrição.

Selecione um perfil de carga de trabalho e use o campo Nome ao executar az containerapp env workload-profile set para a opção --workload-profile-type.

Além de diferentes tamanhos de núcleo e memória, os perfis de carga de trabalho também têm limites de tamanho de imagem variados disponíveis. Para saber mais sobre os limites de tamanho de imagem para seus aplicativos de contêiner, consulte referência de hardware.

A disponibilidade de diferentes perfis de carga de trabalho varia de acordo com a região.

Consumo de recursos

Você pode restringir o uso de memória e CPU de cada aplicativo dentro de um perfil de carga de trabalho e pode executar vários aplicativos dentro de uma única instância de um perfil de carga de trabalho. No entanto, a quantidade total de recursos disponíveis para um aplicativo de contêiner é menor do que a alocada para um perfil. A diferença entre os recursos alocados e disponíveis é a quantidade reservada pelo tempo de execução dos Aplicativos de Contêiner.

Scaling

Quando a demanda por novos aplicativos ou mais réplicas de um aplicativo existente excede os recursos atuais do perfil, instâncias de perfil podem ser adicionadas.

Ao mesmo tempo, se o número de réplicas necessárias diminuir, as instâncias de perfil poderão ser removidas. Você tem controle sobre as restrições no número mínimo e máximo de instâncias de perfil.

O Azure calcula a cobrança em grande parte com base no número de instâncias de perfil em execução.

Rede

Quando você usa o ambiente de perfil de carga de trabalho, recursos de rede extras que protegem totalmente o tráfego de rede de entrada e saída (como rotas definidas pelo usuário) estão disponíveis. Para saber mais sobre quais recursos de rede são suportados, consulte Rede no ambiente de Aplicativos de Contêiner do Azure. Para obter etapas sobre como proteger sua rede com Aplicativos de Contêiner, consulte a seção bloquear seu ambiente de Aplicativo de Contêiner.

Próximas etapas