Perfis de carga de trabalho no Azure Container Apps

Um perfil de carga de trabalho determina a quantidade de recursos de computação e memória disponíveis para os aplicativos de contêiner implantados em um ambiente.

Os perfis são configurados para atender às diferentes necessidades de seus aplicativos.

Tipo de perfil Description Utilização potencial
Consumo Adicionado automaticamente a qualquer novo ambiente. Aplicações que não requerem requisitos de hardware específicos
Dedicado (Propósito geral) Equilíbrio de memória e recursos de computação Aplicações que requerem maiores quantidades de CPU e/ou memória
Dedicado (memória otimizada) Aumento dos recursos de memória Aplicativos que precisam de acesso a grandes dados na memória, modelos de aprendizado de máquina na memória ou outros requisitos de alta memória
Dedicado (GPU habilitada) (visualização) GPU habilitada com maior memória e recursos de computação disponíveis nas regiões Oeste dos EUA 3 e Norte da Europa. Aplicativos que exigem GPU

Nota

Ao usar perfis de carga de trabalho habilitados para GPU, verifique se seu aplicativo está executando a versão mais recente do CUDA.

O perfil de carga de trabalho de consumo é o perfil padrão adicionado a cada tipo de ambiente de perfis de carga de trabalho. Você pode adicionar perfis de carga de trabalho dedicados ao seu ambiente à medida que cria um ambiente ou depois que ele é criado. Os ambientes de perfis de carga de trabalho são implantados separadamente dos ambientes somente de consumo.

Para cada perfil de carga de trabalho dedicada em seu ambiente, você pode:

  • Selecione o tipo e o tamanho
  • Implantar vários aplicativos no perfil
  • Use o dimensionamento automático para adicionar e remover instâncias com base nas necessidades dos aplicativos
  • Limitar o dimensionamento do perfil para controlar melhor os custos

Você pode configurar cada um dos seus aplicativos para serem executados em qualquer um dos perfis de carga de trabalho definidos em seu ambiente de Aplicativos de Contêiner. Essa configuração é ideal para implantar microsserviços em que cada aplicativo pode ser executado na infraestrutura de computação apropriada.

Nota

Você só pode aplicar um perfil de carga de trabalho GPU a um ambiente à medida que o ambiente é criado.

Tipos de perfil

Existem diferentes tipos e tamanhos de perfis de carga de trabalho disponíveis por região. Por padrão, cada plano dedicado inclui um perfil de consumo, mas você também pode adicionar qualquer um dos seguintes perfis:

Nome a apresentar Nome vCPU Memória (GiB) GPU Categoria Alocação
Consumo Consumo 4 8 - Consumo por réplica
Dedicado-D4 D4 4 16 - Fins gerais por nó
Dedicado-D8 D 8 8 32 - Fins gerais por nó
Dedicado-D16 D 16 16 64 - Fins gerais por nó
Dedicado-D32 D 32 32 128 - Fins gerais por nó
Dedicado-E4 E4 4 32 - Com otimização de memória por nó
Dedicado-E8 E8 8 64 - Com otimização de memória por nó
Dedicado-E16 E 16 16 128 - Com otimização de memória por nó
Dedicado-E32 E 32 32 256 - Com otimização de memória por nó
Dedicado-NC24-A100 (pré-visualização) NC24-A100 24 220 1 GPU ativada por nó*
Dedicado-NC48-A100 (visualização) NC48-A100 48 440 2 GPU ativada por nó*
Dedicado-NC96-A100 (visualização) NC96-A100 96 880 4 GPU ativada por nó*

* A capacidade é atribuída caso a caso. Envie um tíquete de suporte para solicitar o valor de capacidade necessário para sua inscrição.

Selecione um perfil de carga de trabalho e use o campo Nome ao executar az containerapp env workload-profile set a --workload-profile-type opção.

Além de diferentes tamanhos de núcleo e memória, os perfis de carga de trabalho também têm limites de tamanho de imagem variáveis disponíveis. Para saber mais sobre os limites de tamanho de imagem para seus aplicativos de contêiner, consulte Referência de hardware.

A disponibilidade de diferentes perfis de carga de trabalho varia de acordo com a região.

Consumo de recursos

Você pode restringir a memória e o uso da CPU de cada aplicativo dentro de um perfil de carga de trabalho e pode executar vários aplicativos dentro de uma única instância de um perfil de carga de trabalho. No entanto, a quantidade total de recursos disponíveis para um aplicativo de contêiner é menor do que o alocado para um perfil. A diferença entre recursos alocados e disponíveis é a quantidade reservada pelo tempo de execução dos Aplicativos de Contêiner.

Dimensionamento

Quando a demanda por novos aplicativos ou mais réplicas de um aplicativo existente excede os recursos atuais do perfil, instâncias de perfil podem ser adicionadas.

Ao mesmo tempo, se o número de réplicas necessárias diminuir, as instâncias de perfil poderão ser removidas. Você tem controle sobre as restrições no número mínimo e máximo de instâncias de perfil.

O Azure calcula a faturação em grande parte com base no número de instâncias de perfil em execução.

Rede

Quando você usa o ambiente de perfil de carga de trabalho, recursos de rede adicionais que protegem totalmente seu tráfego de rede de entrada e saída (como rotas definidas pelo usuário) estão disponíveis. Para saber mais sobre quais recursos de rede são suportados, consulte Rede no ambiente de Aplicativos de Contêiner do Azure. Para obter etapas sobre como proteger sua rede com Aplicativos de Contêiner, consulte a seção Bloquear seu ambiente de Aplicativo de Contêiner.

Próximos passos