Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
APLICA-SE A: Developer | Basic | Basic v2 | Standard | Standard v2 | Premium | Premium v2
O Gerenciamento de API fornece métricas do Azure Monitor para detetar o uso da capacidade do sistema, ajudando você a solucionar problemas de gateway e tomar decisões informadas sobre dimensionar ou atualizar uma instância de Gerenciamento de API para acomodar mais carga.
Este artigo explica as métricas de capacidade e como elas se comportam, mostra como acessar as métricas de capacidade no portal do Azure e sugere quando considerar dimensionar ou atualizar sua instância de Gerenciamento de API.
Importante
Este artigo apresenta como monitorar e dimensionar sua instância de Gerenciamento de API do Azure com base em métricas de capacidade. No entanto, quando uma instância atinge sua capacidade, ela não é acelerada para evitar sobrecarga. Em vez disso, ele agirá como um servidor Web sobrecarregado: latência aumentada, conexões interrompidas e erros de tempo limite. Os clientes de API devem estar prontos para lidar com esses problemas como fazem com outros serviços externos, por exemplo, usando políticas de repetição.
Sugestão
As equipes de API podem usar esse recurso em espaços de trabalho. Os espaços de trabalho fornecem acesso administrativo isolado às APIs e possuem os seus próprios ambientes de execução de API.
Pré-requisitos
Para seguir as etapas neste artigo, você deve ter uma instância de Gerenciamento de API em uma das camadas que ofereça suporte a métricas de capacidade. Para obter mais informações, consulte Criar uma instância de Gerenciamento de API do Azure.
Métricas de capacidade disponíveis
Diferentes métricas de capacidade estão disponíveis nas camadas de serviço v2, camadas clássicas e gateways de espaço de trabalho.
Nas camadas v2, as seguintes métricas estão disponíveis:
Porcentagem de CPU do gateway - A porcentagem de capacidade da CPU usada pelas unidades de gateway.
Porcentagem de memória do gateway - A porcentagem da capacidade de memória usada pelas unidades de gateway.
Observação
Atualmente, a métrica Porcentagem de memória do gateway não é suportada na camada Premium v2.
As agregações disponíveis para essas métricas são as seguintes.
- Média - Porcentagem média de capacidade usada nos processos de gateway em cada unidade de uma instância de Gerenciamento de API.
- Max - Percentagem de capacidade no processo de gateway com maior utilização.
O uso da CPU e da memória revela o consumo de recursos por:
- Serviços de plano de dados de Gerenciamento de API, como processamento de solicitações, que podem incluir o encaminhamento de solicitações ou a execução de uma política.
- Serviços do plano de Gerenciamento de API, como ações de gestão aplicadas por meio do portal do Azure ou do Gerenciador de Recursos do Azure, ou tráfego proveniente do portal do desenvolvedor.
- Processos selecionados do sistema operativo, incluindo processos que envolvem o custo associado aos handshakes TLS em novas ligações.
- Atualizações de plataforma, como atualizações do sistema operacional nos recursos de computação subjacentes para a instância.
- Número de APIs implantadas, independentemente da atividade, que podem consumir capacidade adicional.
Comportamento da métrica de capacidade
Na vida real, as métricas de capacidade podem ser afetadas por muitas variáveis, por exemplo:
- padrões de conexão (nova conexão em uma solicitação versus reutilização da conexão existente)
- Tamanho de uma solicitação e resposta
- políticas configuradas em cada API ou número de clientes que enviam solicitações.
Quanto mais complexas forem as operações nas solicitações, maior será o consumo de capacidade. Por exemplo, políticas de transformação complexas consomem muito mais CPU do que um simples encaminhamento de solicitação. Respostas lentas do serviço de back-end também aumentam isso.
Importante
As métricas de capacidade não são medidas diretas do número de solicitações que estão sendo processadas.
As métricas de capacidade também podem aumentar intermitentemente ou ser maiores que zero, mesmo que nenhuma solicitação esteja sendo processada. Isso acontece por causa de ações específicas do sistema ou da plataforma e não deve ser levado em consideração ao decidir se deve dimensionar uma instância.
Embora as métricas de capacidade sejam projetadas para revelar problemas com sua instância de Gerenciamento de API (ou gateway de espaço de trabalho), há casos em que os problemas não serão refletidos em alterações nessas métricas. Além disso, as métricas de baixa capacidade não significam necessariamente que sua instância de Gerenciamento de API não esteja enfrentando problemas.
Usar o portal do Azure para examinar métricas de capacidade
Acesse métricas no portal para entender quanta capacidade é usada ao longo do tempo.
- Navegue até sua instância de Gerenciamento de API no portal do Azure.
- No menu à esquerda, em Monitoramento, selecione Métricas.
- Selecione a métrica Porcentagem de CPU do gateway ou Porcentagem de memória do gateway nas métricas disponíveis. Escolha a agregação média padrão ou selecione a agregação máxima para ver o pico de uso.
- Escolha um período de tempo desejado na barra superior da seção.
Importante
Atualmente, a métrica Capacidade também aparece no portal para instâncias em camadas v2. No entanto, ele não é suportado para uso nas camadas v2 e mostra um valor de 0.
Observação
Você pode definir um alerta de métrica para informar quando algo inesperado está acontecendo. Por exemplo, receba notificações quando sua instância de Gerenciamento de API tiver excedido o pico esperado de uso de CPU ou memória por mais de 20 minutos.
Usar capacidade para decisões de escalonamento
Use métricas de capacidade para tomar decisões sobre dimensionar uma instância de Gerenciamento de API (ou gateway de espaço de trabalho) para acomodar mais carga. As considerações gerais são as seguintes:
- Observe uma tendência de longo prazo e a média.
- Ignore picos repentinos que provavelmente não estão relacionados a um aumento na carga (consulte a seção Comportamento da métrica de capacidade para obter explicações).
- Como regra geral, atualize ou dimensione sua instância quando um valor de métrica de capacidade exceder 60% - 70% por um longo período de tempo (por exemplo, 30 minutos). Valores diferentes podem funcionar melhor para o seu serviço ou cenário.
- Se a sua instância ou gateway do espaço de trabalho estiver configurado com apenas 1 unidade, atualize ou dimensione-o quando um valor de métrica de capacidade exceder 40% durante um longo período. Esta recomendação baseia-se na necessidade de reservar capacidade para atualizações do SO convidado na plataforma de serviço subjacente.
Sugestão
Se você puder estimar seu tráfego com antecedência, teste sua instância de Gerenciamento de API ou gateway de espaço de trabalho nas cargas de trabalho esperadas. Você pode aumentar a carga de solicitação gradualmente e monitorar o valor da métrica de capacidade que corresponde à sua carga de pico. Siga as etapas da seção anterior para usar o portal do Azure para entender quanta capacidade é usada em determinado momento.
Importante
Ao definir regras de dimensionamento automático, certifique-se de evitar oscilações de dimensionamento automático que possam causar um ciclo de redução/aumento. Para saber mais, recomendamos a leitura das orientações do Azure Monitor Autoscale sobre flapping.