Compartilhar via


O dimensionador automático de cluster falha ao dimensionar com o erro "não é possível dimensionar o pool de nós habilitado para dimensionador automático de cluster"

Este artigo discute como resolver o erro "não é possível escalar o pool de nós com escalonador automático" que ocorre quando você escala um cluster com um pool de nós habilitado para escalonador automático.

Sintomas

Você recebe uma mensagem de erro semelhante à seguinte mensagem:

kubectl get nodes outputs "Nenhum recurso encontrado"
O estado de todos os pods é Pending
As operações de escala estão falhando com o erro "Não é possível dimensionar o pool de nós habilitado para dimensionador automático de cluster"

Lista de verificação de solução de problemas

O AKS (Serviço de Kubernetes do Azure) usa pools de agentes baseados em Conjuntos de Dimensionamento de Máquinas Virtuais do Azure. Esses pools contêm nós de cluster e recursos de dimensionamento automático de cluster, se estiverem habilitados.

Verificar se o conjunto de dimensionamento de máquinas virtuais do cluster existe

  1. Entre no portal do Azure.

  2. Localize o grupo de recursos do nó pesquisando os seguintes nomes:

    • O nome padrão MC_{AksResourceGroupName}_{YourAksClusterName}_{AksResourceLocation}
    • O nome personalizado (se ele tiver sido fornecido na criação)

    Observação

    Quando você cria um cluster, o AKS cria automaticamente um segundo grupo de recursos para armazenar os recursos do AKS. Para obter mais informações, confira Por que dois grupos de recursos são criados com o AKS?

  3. Verifique a lista de recursos para verificar se existe um conjunto de dimensionamento de máquinas virtuais.

Causa 1: o conjunto de dimensionamento de máquinas virtuais do cluster foi excluído

Se você excluir o conjunto de dimensionamento de máquinas virtuais anexado ao cluster, essa ação fará com que o dimensionador automático do cluster falhe. Isso também causa problemas quando você provisiona recursos como nós e pods.

Observação

Modificar qualquer recurso no grupo de recursos do nó no cluster do AKS é uma ação sem suporte e causa falhas na operação do cluster. Você pode impedir que alterações sejam feitas no grupo de recursos do nó impedindo que os usuários modifiquem os recursos gerenciados pelo cluster do AKS.

Reconciliar grupo de nós

Se o conjunto de escala de máquinas virtuais do cluster for excluído acidentalmente, você poderá reconciliar o pool de nós usando az aks nodepool update:

# Update Node Pool Configuration
az aks nodepool update --resource-group <resource-group-name> --cluster-name <cluster-name> --name <nodepool-name> --tags <tags> --node-taints <taints> --labels <labels>

# Verify the Update
az aks nodepool show --resource-group <resource-group-name> --cluster-name <cluster-name> --name <nodepool-name>

Monitore o pool de nós para verificar se ele está funcionando conforme o esperado e se todos os nós estão operacionais.

Causa 2: Tags ou quaisquer outras propriedades foram modificadas do grupo de recursos do nó

Você poderá enfrentar erros de dimensionamento se modificar ou excluir tags criadas no Azure e outras propriedades de recursos no grupo de recursos do nó. Para obter mais informações, consulte Posso modificar marcas e outras propriedades dos recursos do AKS no grupo de recursos do nó?

Reconciliar tags do grupo de recursos do nó

Use a CLI do Azure para garantir que as tags corretas para o nome do AKS e o nome do grupo do AKS estejam no grupo de recursos do nó:

# Add or update tags for AKS name and AKS group name
az group update --name <node-resource-group-name> --set tags.AKS-Managed-Cluster-Name=<aks-managed-cluster-name> tags.AKS-Managed-Cluster-RG=<aks-managed-cluster-rg>

# Verify the tags
az group show --name <node-resource-group-name> --query "tags"

Monitore o grupo de recursos para garantir que as tags sejam aplicadas corretamente e que o grupo de recursos esteja funcionando conforme o esperado.

Causa 3: o grupo de recursos do nó do cluster foi excluído

A exclusão do grupo de recursos do nó de cluster causa problemas ao provisionar os recursos de infraestrutura exigidos pelo cluster. Essa ação faz com que o dimensionador automático do cluster falhe.

Solução: atualize o cluster para o estado de meta sem alterar a configuração

Para resolver esse problema, execute o comando a seguir para recuperar o conjunto de escalas de máquinas virtuais excluído ou quaisquer tags (ausentes ou modificadas).

Observação

Pode levar alguns minutos até que a operação seja concluída.

az aks update --resource-group <resource-group-name> --name <aks-cluster-name>

Dicas adicionais de solução de problemas

  • Verifique se há alterações ou exclusões recentes no Log de Atividades do Azure.

Entre em contato conosco para obter ajuda

Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.