Solucionar problemas de logs de eventos de integridade do balanceador de carga
Neste artigo, você aprenderá a solucionar problemas de logs de eventos de integridade comuns para o Balanceador de Carga do Azure. Ele abrange muitos logs de eventos de integridade comuns que você pode encontrar ao usar o Balanceador de Carga do Azure.
Evento DataPathAvailabilityWarning
A métrica de Disponibilidade do Caminho de Dados do seu balanceador de carga caiu abaixo de 90% devido a possíveis problemas na plataforma. Esse evento também pode ser causado ao atingir outros limites da plataforma Azure.
Exemplo de evento
Warning - DataPathAvailabilityWarning: The data path availability for frontend IP 20.29.152.178 is below 90% on the following ports: 80. To mitigate this issue, please refer to aka.ms/lbhealth for more detailed event definitions and troubleshooting guidance.
Passos de resolução de problemas
- Confirme se pelo menos uma instância de back-end está respondendo à sonda de integridade configurada para a regra de balanceamento de carga associada. A regra inclui o IP frontend, o protocolo e a porta fornecidos na descrição do evento.
- Se sim, vá para a próxima etapa para o status do Azure.
- Se não, consulte Solucionar problemas de status da sonda de integridade do Balanceador de Carga do Azure | para obter etapas de solução de problemas mais detalhadas.
- Visite o status do Azure para identificar se há algum problema conhecido de plataforma ou infraestrutura do Azure que possa estar afetando seu recurso de balanceador de carga.
- Entre em contato com o suporte do Azure para uma investigação mais aprofundada se você estiver observando esses eventos em seus logs e estiver enfrentando problemas contínuos de conectividade.
DataPathAvailabilityEvento crítico
A métrica DataPathAvailability do seu balanceador de carga caiu abaixo de 25% devido a possíveis problemas na plataforma. Esse evento também pode ser causado ao atingir outros limites da plataforma Azure.
Exemplo de evento
Critical - DataPathAvailabilityCritical: The data path availability for frontend IP {FrontendIPAddress} is below 25% on the following ports: {LoadBalancingRulePorts}. To mitigate this issue, please refer to aka.ms/lbhealth for more detailed event definitions and troubleshooting guidance.
Passos de resolução de problemas
- Confirme se pelo menos uma instância de back-end está respondendo à sonda de integridade configurada para a regra de balanceamento de carga associada. A regra inclui o IP frontend, o protocolo e a porta fornecidos na descrição do evento.
- Se sim, vá para a próxima etapa para o status do Azure.
- Se não, consulte Solucionar problemas de status da sonda de integridade do Balanceador de Carga do Azure | Microsoft Learn para obter etapas de solução de problemas mais detalhadas.
- Visite o status do Azure para identificar se há algum problema conhecido de plataforma ou infraestrutura do Azure que possa estar afetando seu recurso de balanceador de carga.
- Entre em contato com o suporte do Azure para uma investigação mais aprofundada se você estiver observando esses eventos em seus logs e estiver enfrentando problemas contínuos de conectividade.
Evento NoHealthyBackends
As instâncias de back-end do seu balanceador de carga não estão respondendo a testes de integridade. A configuração incorreta do balanceador de carga ou das instâncias de back-end pode causar esse evento. Motivos comuns:
- Um firewall ou regras de grupo de segurança de rede estão bloqueando o IP ou as portas da sonda de integridade.
- O aplicativo não está escutando na porta da sonda de integridade configurada ou a sonda de integridade está configurada para a porta errada.
- Uma investigação de integridade HTTP está configurada, mas o aplicativo não está respondendo com o código de status 200 OK.
Exemplo de evento
Critical - NoHealthyBackends: the frontend IP {FrontendIPAddress} is completely unreachable because all backend instances configured to the following protocol:port {Protocol:Port, Protocol:Port,...} are not responding to health probes. Please review the associated health probe configuration(s) and ensure that at least one of the backend instances are responding to the health probes on the configured ports. To mitigate this issue, please refer to aka.ms/lbhealth for more detailed event definitions and troubleshooting guidance.
Passos de resolução de problemas
Consulte Solucionar problemas de status da sonda de integridade do Balanceador de Carga do Azure | por motivos comuns pelos quais suas instâncias de back-end não estão respondendo às sondas de integridade configuradas.
Evento HighSnatPortUsage
Esse evento indica que você está se aproximando do esgotamento da porta SNAT em instâncias de back-end específicas. Você deseja revisar sua arquitetura de conectividade de saída.
Exemplo de evento
Warning - High SNAT Port Usage: Backend IP {BackendIPAddress} is utilizing more than 75% of SNAT ports allocated from frontend IP {FrontendIPAddress} and is at-risk for SNAT port exhaustion. To reduce the risk of SNAT exhaustion, please refer to aka.ms/lbhealth for more detailed event definitions and troubleshooting guidance.
Passos de resolução de problemas
- Para obter mais informações sobre as opções comuns de conectividade de saída do Azure, consulte Tradução de endereços de rede de origem (SNAT) para conexões de saída - Azure Load Balancer.
- Para cenários de produção, recomendamos o uso do NAT Gateway para suas necessidades de conectividade de saída. NAT Gateway fornece alocação SNAT dinâmica, reduzindo assim o risco de conexões com falha devido à exaustão da porta SNAT. Para obter etapas detalhadas sobre como melhorar sua arquitetura de conectividade de saída, consulte a seção Etapas de solução de problemas na seção de eventos SnatPortExhaustion neste artigo.
Evento SnatPortExhaustion
Esse evento indica que todas as portas SNAT alocadas estão esgotadas para uma ou mais instâncias de back-end esgotadas.
Exemplo de evento
Critical - SNATPortExhaustion: Backend IP {BackendIPAddress} has exhausted all SNAT ports allocated to it. One of the frontend IPs where the backend IP gets SNAT port is {FrontendIPAddress}. To reduce the risk of SNAT exhaustion, please refer to aka.ms/lbhealth for more detailed event definitions and troubleshooting guidance.
Passos de resolução de problemas
- Para resolver problemas de exaustão do SNAT, recomendamos o uso do NAT Gateway. Para saber mais sobre como o Gateway NAT reduz o risco de esgotamento da porta SNAT, consulte mais em Tradução de Endereço de Rede de Origem (SNAT) com o Gateway NAT do Azure.
- Se você estiver usando regras de saída do balanceador de carga e quiser migrar para usar o gateway NAT, consulte Tutorial: Migrar acesso de saída para gateway NAT.
- Para identificar as conexões afetadas devido à exaustão da porta SNAT:
- No portal do Azure, selecione seu recurso de balanceador de carga.
- Na Visão geral do balanceador de carga, selecione Monitoramento> de métricas no menu à esquerda.
- Na janela Métricas, selecione a métrica de Contagem de Conexão SNAT e agregação de Soma.
- Selecione Aplicar divisão e selecione o valor de Estado da conexão.
- Se o Estado da Conexão for igual a Falha, isso indicará o número de conexões com falha devido ao esgotamento da porta SNAT.
Soluções alternativas
- Certifique-se de que configurou as regras de saída através da atribuição manual de portas e de que está a atribuir o número máximo de portas possível.
- Adicione IPs públicos extras ao seu Load Balancer ou NAT Gateway.
Próximos passos
Neste artigo, você aprendeu como solucionar problemas de cada tipo de evento de integridade do Balanceador de Carga do Azure.
Para obter mais informações sobre logs de eventos de integridade do Balanceador de Carga do Azure e tipos de eventos de integridade, ou como coletar, analisar e criar alertas usando esses logs, consulte: