Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo descreve como identificar e resolver o ZonalAllocationFailed
, AllocationFailed
ou OverconstrainedAllocationRequest
erro que pode ocorrer quando você tenta criar, implantar ou atualizar um cluster do Serviço de Kubernetes do Azure (AKS).
Pré-requisitos
CLI do Azure (opcional), versão 2.0.59 ou posterior. Se a CLI do Azure já estiver instalada, você poderá encontrar o número da versão usando
az --version
.
Sintomas
Ao tentar criar um cluster do AKS, você recebe a seguinte mensagem de erro:
Reconciliar erro do pool de agentes VMSS: Falha ao tentar novamente o VMSSAgentPoolReconciler:
Categoria: InternalError;
Subcódigo: ZonalAllocationFailed;
Dependência: Microsoft.Compute/VirtualMachineScaleSet;
CodigoDeErroOriginal: Código="AlocaçãoDeZonaFalhou"
Message="Falha na alocação. Não temos capacidade suficiente para o tamanho de VM solicitado nesta zona. Leia mais sobre como melhorar a probabilidade de sucesso da alocação em https://aka.ms/allocation-guidance";
AKSTeam: NodeProvisioning
Ou, ao tentar atualizar ou escalar verticalmente um cluster, você recebe a seguinte mensagem de erro:
Code="OverconstrainedAllocationRequest"
Message="Falha na alocação. As VMs com as restrições a seguir não podem ser alocadas, pois a condição é muito restritiva. Por favor, remova algumas restrições e tente novamente."
Ou, quando você usa hosts dedicados em um cluster e tenta criar ou escalar um pool de nós, recebe a seguinte mensagem de erro:
Código="AlocaçãoFalhou"
Message="Falha na alocação. Falha na alocação de VM para o host dedicado. Certifique-se de que o host dedicado tenha capacidade suficiente ou tente alocar em outro lugar."
Causa 1: disponibilidade de zona limitada em um SKU
Você está tentando implantar, atualizar ou escalar verticalmente um cluster em uma zona que tem disponibilidade limitada para o SKU específico.
Solução 1: usar um SKU, uma zona ou uma região diferente
Tente um ou mais dos seguintes métodos:
- Reimplante o cluster na mesma região usando um SKU diferente.
- Reimplante o cluster em uma zona diferente nessa região.
- Reimplante o cluster em uma região diferente.
- Crie um novo pool de nós em uma zona diferente ou use um SKU diferente.
Para obter mais informações sobre como corrigir esse erro, consulte Resolver erros para SKU não disponível.
Causa 2: Muitas restrições para serem acomodadas por uma máquina virtual
Se você receber um código de OverconstrainedAllocationRequest
erro, a plataforma de Computação do Azure não poderá alocar uma nova VM (máquina virtual) para acomodar as restrições necessárias. Essas restrições geralmente (mas nem sempre) incluem os seguintes itens:
- Tamanho da VM
- SKU da VM
- Redes aceleradas
- Zona de disponibilidade
- Disco efêmero
- Grupo de posicionamento por proximidade (PPG)
Solução 2: Não associar um grupo de posicionamento por proximidade ao pool de nós
Se você receber um erro de código OverconstrainedAllocationRequest
, tente criar um novo pool de nós que não esteja associado a um grupo de localização por proximidade.
Causa 3: hosts dedicados ou domínios de falha insuficientes
Você está tentando implantar um pool de nós em um grupo de hosts dedicado que tem capacidade limitada ou não atende à restrição de domínio de falha.
Solução 3: verifique se você tem hosts dedicados suficientes para seus nós/VMSS do AKS
De acordo com o Planejamento da Capacidade do ADH no AKS, você é responsável por planejar hosts dedicados suficientes para abranger tantos domínios de falha quanto exigido pelo VMSS do AKS. Por exemplo, se o VMSS do AKS for criado com FaultDomainCount=2, você precisará de pelo menos dois hosts dedicados em domínios de falha diferentes (FaultDomain 0 e FaultDomain 1).
Mais informações
Garantir a capacidade dos usuários é uma prioridade máxima para a Microsoft, e estamos trabalhando sem parar para atingir essa meta. A crescente popularidade dos serviços do Azure enfatiza a necessidade de expandir nossa infraestrutura ainda mais rapidamente. Com isso em mente, estamos acelerando as expansões e melhorando nosso processo de implantação de recursos para responder à forte demanda dos clientes. Também estamos adicionando uma grande quantidade de infraestrutura de computação mensalmente.
Identificamos vários métodos para melhorar a forma como balanceamos a carga em uma situação de alto uso de recursos e como acionar a implantação oportuna dos recursos necessários. Além disso, estamos aumentando significativamente nossa capacidade e continuaremos a planejar uma forte demanda em todas as regiões. Para obter mais informações sobre as melhorias que estamos fazendo para fornecer uma cadeia de suprimentos de nuvem resiliente, consulte Avançando a confiabilidade por meio de uma cadeia de suprimentos de nuvem resiliente.
Referências
Entre em contato conosco para obter ajuda
Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.