Capacidade de uma instância de Gerenciamento de API do Azure

O Gerenciamento de API fornece métricas do Azure Monitor para detetar o uso da capacidade do sistema, ajudando você a solucionar problemas de gateway e tomar decisões informadas sobre dimensionar ou atualizar uma instância de Gerenciamento de API para acomodar mais carga.

Este artigo explica as métricas de capacidade e como elas se comportam, mostra como acessar as métricas de capacidade no portal do Azure e sugere quando considerar dimensionar ou atualizar sua instância de Gerenciamento de API.

Importante

Este artigo apresenta como monitorar e dimensionar sua instância de Gerenciamento de API do Azure com base em métricas de capacidade. No entanto, quando uma instância atinge sua capacidade, ela não é acelerada para evitar sobrecarga. Em vez disso, ele agirá como um servidor Web sobrecarregado: latência aumentada, conexões interrompidas e erros de tempo limite. Os clientes de API devem estar prontos para lidar com esses problemas como fazem com outros serviços externos, por exemplo, usando políticas de repetição.

Sugestão

As equipes de API podem usar esse recurso em espaços de trabalho. Os espaços de trabalho fornecem acesso administrativo isolado às APIs e possuem os seus próprios ambientes de execução de API.

Pré-requisitos

Para seguir as etapas neste artigo, você deve ter uma instância de Gerenciamento de API em uma das camadas que ofereça suporte a métricas de capacidade. Para obter mais informações, consulte Criar uma instância de Gerenciamento de API do Azure.

Métricas de capacidade disponíveis

Diferentes métricas de capacidade estão disponíveis nas camadas de serviço v2, camadas clássicas e gateways de espaço de trabalho.

Nas camadas v2, as seguintes métricas estão disponíveis:

Porcentagem de CPU do gateway - A porcentagem de capacidade da CPU usada pelas unidades de gateway.
Porcentagem de memória do gateway - A porcentagem da capacidade de memória usada pelas unidades de gateway.

As agregações disponíveis para essas métricas são as seguintes.

Média - Porcentagem média de capacidade usada nos processos de gateway em cada unidade de uma instância de Gerenciamento de API.
Max - Percentagem de capacidade no processo de gateway com maior utilização.

O uso da CPU e da memória revela o consumo de recursos por:

Serviços de plano de dados de Gerenciamento de API, como processamento de solicitações, que podem incluir o encaminhamento de solicitações ou a execução de uma política.
Serviços do plano de Gerenciamento de API, como ações de gestão aplicadas por meio do portal do Azure ou do Gerenciador de Recursos do Azure, ou tráfego proveniente do portal do desenvolvedor.
Processos selecionados do sistema operativo, incluindo processos que envolvem o custo associado aos handshakes TLS em novas ligações.
Atualizações de plataforma, como atualizações do sistema operacional nos recursos de computação subjacentes para a instância.
Número de APIs implantadas, independentemente da atividade, que podem consumir capacidade adicional.

Comportamento da métrica de capacidade

Na vida real, as métricas de capacidade podem ser afetadas por muitas variáveis, por exemplo:

padrões de conexão (nova conexão em uma solicitação versus reutilização da conexão existente)
Tamanho de uma solicitação e resposta
políticas configuradas em cada API ou número de clientes que enviam solicitações.

Quanto mais complexas forem as operações nas solicitações, maior será o consumo de capacidade. Por exemplo, políticas de transformação complexas consomem muito mais CPU do que um simples encaminhamento de solicitação. Respostas lentas do serviço de back-end também aumentam isso.

Importante

As métricas de capacidade não são medidas diretas do número de solicitações que estão sendo processadas.

Picos métricos de capacidade

As métricas de capacidade também podem aumentar intermitentemente ou ser maiores que zero, mesmo que nenhuma solicitação esteja sendo processada. Isso acontece por causa de ações específicas do sistema ou da plataforma e não deve ser levado em consideração ao decidir se deve dimensionar uma instância.

Embora as métricas de capacidade sejam projetadas para revelar problemas com sua instância de Gerenciamento de API (ou gateway de espaço de trabalho), há casos em que os problemas não serão refletidos em alterações nessas métricas. Além disso, as métricas de baixa capacidade não significam necessariamente que sua instância de Gerenciamento de API não esteja enfrentando problemas.

Usar o portal do Azure para examinar métricas de capacidade

Acesse métricas no portal para entender quanta capacidade é usada ao longo do tempo.

Navegue até sua instância de Gerenciamento de API no portal do Azure.
No menu à esquerda, em Monitoramento, selecione Métricas.
Selecione a métrica Porcentagem de CPU do gateway ou Porcentagem de memória do gateway nas métricas disponíveis. Escolha a agregação média padrão ou selecione a agregação máxima para ver o pico de uso.
Escolha um período de tempo desejado na barra superior da seção.

Importante

Atualmente, a métrica Capacidade também aparece no portal para instâncias em camadas v2. No entanto, ele não é suportado para uso nas camadas v2 e mostra um valor de 0.

Observação

Você pode definir um alerta de métrica para informar quando algo inesperado está acontecendo. Por exemplo, receba notificações quando sua instância de Gerenciamento de API tiver excedido o pico esperado de uso de CPU ou memória por mais de 20 minutos.

Usar capacidade para decisões de escalonamento

Use métricas de capacidade para tomar decisões sobre dimensionar uma instância de Gerenciamento de API (ou gateway de espaço de trabalho) para acomodar mais carga. As considerações gerais são as seguintes:

Observe uma tendência de longo prazo e a média.
Ignore picos repentinos que provavelmente não estão relacionados a um aumento na carga (consulte a seção Comportamento da métrica de capacidade para obter explicações).
Como regra geral, atualize ou dimensione sua instância quando um valor de métrica de capacidade exceder 60% - 70% por um longo período de tempo (por exemplo, 30 minutos). Valores diferentes podem funcionar melhor para o seu serviço ou cenário.
Se a sua instância ou gateway do espaço de trabalho estiver configurado com apenas 1 unidade, atualize ou dimensione-o quando um valor de métrica de capacidade exceder 40% durante um longo período. Esta recomendação baseia-se na necessidade de reservar capacidade para atualizações do SO convidado na plataforma de serviço subjacente.
Use os diagnósticos disponíveis para monitorar os tempos de resposta de chamadas de API. Considere ajustar os limites de dimensionamento se notar tempos de resposta degradados com o aumento do valor da métrica de capacidade.
Para os níveis clássicos, descarte o ponto de dados mais recente de 1 minuto ao ler métricas brutas de capacidade de Gestão de API do Azure porque o valor derivado pode ser inválido se os dados de origem não estiverem disponíveis na altura da agregação; Não baseie as decisões operacionais ou de escalabilidade em valores de 1 minuto — para o autoescalonamento use janelas médias de agregação de 30 minutos ou mais, avalie condições sustentadas antes de escalar e anote dashboards para excluir o último ponto de 1 minuto, de modo a que as tendências reflitam dados fiáveis.

Sugestão

Se você puder estimar seu tráfego com antecedência, teste sua instância de Gerenciamento de API ou gateway de espaço de trabalho nas cargas de trabalho esperadas. Você pode aumentar a carga de solicitação gradualmente e monitorar o valor da métrica de capacidade que corresponde à sua carga de pico. Siga as etapas da seção anterior para usar o portal do Azure para entender quanta capacidade é usada em determinado momento.

Importante

Ao definir regras de dimensionamento automático, certifique-se de evitar oscilações de dimensionamento automático que possam causar um ciclo de redução/aumento. Para saber mais, recomendamos a leitura das orientações do Azure Monitor Autoscale sobre flapping.

Comentários

Esta página foi útil?

Last updated on 2025-07-17

Capacidade de uma instância de Gerenciamento de API do Azure

Pré-requisitos

Métricas de capacidade disponíveis

Comportamento da métrica de capacidade

Usar o portal do Azure para examinar métricas de capacidade

Usar capacidade para decisões de escalonamento

Conteúdo relacionado

Comentários

Recursos adicionais