Solucionar problemas de falhas não prontas do nó que são seguidas por recuperações
Este artigo ajuda a solucionar cenários em que um nó dentro de um cluster do AKS (Microsoft Serviço de Kubernetes do Azure) mostra o Nó Não Pronto status, mas se recupera automaticamente para um estado saudável.
Sintomas
Você observa que seu aplicativo para de responder enquanto o nó está relatando que ele tem um status Não Pronto. No entanto, o nó se recupera automaticamente e, agora, ele está procurando uma RCA (análise de causa raiz).
Motivo
As possíveis causas desse problema incluem os seguintes cenários:
O servidor de API não está disponível e você está usando uma investigação de preparação para a implantação.
Se um pod estiver em execução, mas não estiver pronto, essa situação significa que a investigação de preparação está falhando. Se a investigação de preparação falhar, o pod não será anexado ao serviço e o tráfego não será encaminhado para a instância do pod.
As falhas de host da VM (máquina virtual) ocorrem. Para determinar se ocorreram falhas de host de VM, marcar as seguintes fontes de informações:
- aks diagnóstico
- status do Azure
- Notificações do Azure (para quaisquer interrupções recentes ou períodos de manutenção)
Prevenção
Para evitar que esse problema ocorra no futuro, tome uma ou mais das seguintes ações:
- Verifique se a camada de serviço está totalmente paga.
- Reduza o número de
watch
solicitações eget
para o servidor de API. - Substitua o pool de nós por um pool de nós íntegro.
Mais informações
- Para obter etapas gerais de solução de problemas, confira Solução de problemas básica de falhas não prontas do nó.