Práticas de triagem para operações do AKS

Uma análise de causa raiz para um cluster do AKS (Serviço de Kubernetes do Azure) geralmente é desafiadora. Para simplificar o processo, considere a triagem de problemas usando uma abordagem de cima para baixo com base na hierarquia do cluster. Comece no nível do cluster e faça uma busca detalhada, se necessário.

Diagram that shows the hierarchy of AKS cluster components: Cluster, node pools, nodes, pods, and containers.

A seção a seguir fornece uma visão geral de uma série sobre práticas de triagem, que descreve a abordagem de cima para baixo em detalhes. Os artigos fornecem exemplos que usam um conjunto de ferramentas e painéis. Os artigos descrevem como esses exemplos destacam sintomas de problemas.

Os problemas comuns abordados nesta série incluem:

  • Os problemas de rede e conectividade causados por configuração inadequada.
  • Comunicação interrompida entre o plano de controle e o nó.
  • Pressões de Kubelet causadas por recursos insuficientes de computação, memória ou armazenamento.
  • Problemas de resolução de DNS (Sistema de Nomes de Domínio).
  • Nós que ficam sem operações IOPS (entrada/saída de disco por segundo).
  • Um pipeline de controle de admissão que bloqueia várias solicitações para o servidor de API.
  • Um cluster que não tem permissões para extrair do registro de contêiner apropriado.

Esta série não se destina a resolver problemas específicos. Para obter informações sobre como solucionar problemas específicos, consulte Solução de problemas do AKS.

A série de práticas de triagem

Etapa Descrição
1. Avalie a integridade do cluster AKS. Verifique a integridade geral do cluster e da rede.
2. Examine a integridade do nó e do pod. Avalie a integridade dos nós de trabalho do AKS.
3. Monitore as implantações de carga de trabalho. Verifique se todas as implantações e os recursos DaemonSet estejam em execução.
4. Valide controladores de admissão. Verifique se os controladores de admissão estão funcionando conforme o esperado.
5. Verifique a conexão com o registro de contêiner. Verifique a conexão com o registro de contêiner

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Autor principal:

Outros colaboradores:

Para ver perfis não públicos no LinkedIn, entre no LinkedIn.

Próximas etapas