Colocação em escala do Gateway de Aplicativo v2 e WAF v2
O Gateway de Aplicativo e o WAF podem ser configurados para dimensionar em dois modos:
- Dimensionamento automático - Com o dimensionamento automático habilitado, os SKUs do Gateway de Aplicativo e WAF v2 escalam horizontalmente ou verticalmente com base nos requisitos de tráfego do aplicativo. Esse modo oferece maior elasticidade ao aplicativo e elimina a necessidade de adivinhar o tamanho do gateway de aplicativo ou a contagem de instâncias. Esse modo também permite economizar custos, não exigindo que o gateway seja executado na capacidade máxima provisionada para a carga máxima de tráfego esperada. Você deve especificar uma contagem mínima e, como opção, uma contagem máxima de instâncias. A capacidade mínima garante que o Gateway de Aplicativo e o WAF v2 não fiquem abaixo da contagem mínima de instâncias especificada, mesmo sem tráfego. Cada instância é aproximadamente equivalente a mais 10 unidades de capacidade reservadas. Zero significa nenhuma capacidade reservada, sendo puramente de dimensionamento automático por natureza. Como opção, você também pode especificar uma contagem máxima de instâncias, o que garante que o Gateway de Aplicativo não seja dimensionado além do número especificado de instâncias. Você só é cobrado pela quantidade de tráfego servido pelo Gateway. As contagens de instâncias podem variar de 0 a 125. O valor padrão da contagem máxima de instâncias é dez, quando não especificado.
Observação
Se a contagem máxima de instâncias for atualizada para um valor menor que a contagem de instâncias atual, a nova configuração não terá efeito imediato. A contagem máxima recém-atualizada só será imposta depois que uma operação de redução horizontal colocar a contagem atual abaixo da contagem máxima recém-atualizada. Se a operação de redução horizontal não ocorrer porque os limites de redução horizontal do dimensionamento automático não forem atendidos, a nova configuração de contagem máxima não será aplicada.
- Manual: você também pode escolher o modo Manual, no qual o gateway não é dimensionado automaticamente. Nesse modo, se houver mais tráfego do que o Gateway de Aplicativo ou WAF pode manipular, isso poderá resultar em perda de tráfego. Com o modo manual, é obrigatório especificar a contagem de instâncias. A contagem de instâncias pode variar de 1 a 125 instâncias.
Observação
Esses modos de dimensionamento não se aplicam ao Gateway de Aplicativo Básico. O Gateway de Aplicativo do Básico é dimensionado automaticamente para cerca de 200 conexões por segundo, com base em um certificado TLS de chave RSA de 2048 bits.
Dimensionamento automático e alta disponibilidade
Os Gateways de Aplicativo do Azure são sempre implantados com alta disponibilidade. O serviço é composto de várias instâncias que são criadas conforme configurado, se o dimensionamento automático estiver desativado, ou exigidas pela carga do aplicativo, se o dimensionamento automático estiver ativado. Do ponto de vista do usuário, você não tem necessariamente visibilidade das instâncias individuais, mas apenas do serviço Gateway de Aplicativo como um todo. Se uma determinada instância tiver um problema e deixar de funcionar, o Gateway de Aplicativo do Azure criará uma nova instância de forma transparente.
Mesmo que você configure o dimensionamento automático com zero instâncias mínimas, o serviço ainda estará altamente disponível, o que está sempre incluído no preço fixo.
No entanto, é importante observar que o provisionamento de uma nova instância pode levar aproximadamente de seis a sete minutos. Compreender o comportamento de escala das instâncias do Gateway de Aplicativo do Azure é fundamental para manter o desempenho sob cargas variadas. Essas instâncias são ampliadas em grupos e o tamanho do grupo aumenta proativamente quando a contagem atual de instâncias é maior. Essa estratégia permite que o sistema gerencie picos de carga de trabalho com eficiência, evitando possíveis interrupções ou lentidão no serviço. Cada instância do Gateway de Aplicativo do Azure pode lidar com até 10 unidades de capacidade. Para otimizar suas configurações de escalonamento automático, considere seus padrões de tráfego típicos e defina as instâncias mínimas de acordo para garantir uma operação tranquila.
Para eventos de escala, o Gateway de Aplicativo drena as conexões existentes por 5 minutos na instância que está sujeita à remoção. Após 5 minutos, as conexões existentes são fechadas e a instância removida. Todas as novas conexões durante ou após o tempo de expansão de 5 minutos são estabelecidas para outras instâncias existentes no mesmo gateway.