이 문서에서는 자동 크기 조정기가 설정된 노드 풀을 사용하여 클러스터를 스케일링할 때 나타나는 "클러스터 자동 크기 조정기 사용 노드 풀의 크기를 조정할 수 없음" 오류를 해결하는 방법을 설명합니다.
증상
다음 메시지와 유사한 오류 메시지가 표시됩니다.
kubectl get nodes출력 "리소스를 찾을 수 없음"
모든 Pod 상태는 다음과 같습니다.Pending
"클러스터 자동 크기 조정기를 사용하도록 설정된 노드 풀의 크기를 조정할 수 없음" 오류로 크기 조정 작업이 실패합니다.
문제 해결 검사 목록
AKS(Azure Kubernetes Service)는 사용하도록 설정된 경우 클러스터 노드 및 클러스터 자동 크기 조정 기능을 포함하는 가상 머신 확장 집합 기반 에이전트 풀을 사용합니다.
클러스터 가상 머신 확장 집합이 있는지 확인합니다.
Azure 포털에로그인합니다.
다음 이름을 검색하여 노드 리소스 그룹을 찾습니다.
- 기본 이름
MC_{AksResourceGroupName}_{YourAksClusterName}_{AksResourceLocation}입니다. - 사용자 지정 이름(만들 때 제공된 경우)입니다.
참고 항목
새 클러스터를 만들면 AKS는 AKS 리소스를 저장할 두 번째 리소스 그룹을 자동으로 만듭니다. 자세한 내용은 AKS를 통해 두 개의 리소스 그룹이 생성되는 이유는 무엇인가요?를 참조하세요.
- 기본 이름
리소스 목록을 확인한 후, 가상 머신 확장 집합이 있는지 확인하십시오.
원인 1: 클러스터 가상 머신 확장 집합이 삭제됨
클러스터에 연결된 가상 머신 확장 집합을 삭제하면 클러스터 자동 크기 조정기가 실패합니다. 또한 노드 및 Pod와 같은 리소스를 프로비전할 때 문제가 발생합니다.
참고 항목
AKS 클러스터의 노드 리소스 그룹 아래에 있는 리소스를 수정하는 것은 지원되지 않는 작업이며 클러스터 작업 오류가 발생합니다. AKS 클러스터에서 관리하는 사용자가 리소스를 수정하지 못하도록 차단하여 노드 리소스 그룹이 변경되는 것을 방지할 수 있습니다.
노드 풀 동기화
클러스터 가상 머신 확장 집합이 실수로 삭제된 경우 다음을 사용하여 az aks nodepool update노드 풀을 조정할 수 있습니다.
# Update Node Pool Configuration
az aks nodepool update --resource-group <resource-group-name> --cluster-name <cluster-name> --name <nodepool-name> --tags <tags> --node-taints <taints> --labels <labels>
# Verify the Update
az aks nodepool show --resource-group <resource-group-name> --cluster-name <cluster-name> --name <nodepool-name>
노드 풀을 모니터링하여 예상대로 작동하고 모든 노드가 작동하는지 확인합니다.
원인 2: 노드 리소스 그룹에서 태그 또는 기타 속성이 수정되었습니다.
노드 리소스 그룹에서 Azure에서 만든 태그 및 기타 리소스 속성을 수정하거나 삭제하면 크기 조정 오류가 발생할 수 있습니다. 자세한 내용은 노드 리소스 그룹에서 AKS 리소스의 태그 및 기타 속성을 수정할 수 있나요?
노드 리소스 그룹 태그 조정
Azure CLI를 사용하여 노드 리소스 그룹에 AKS 이름과 AKS 그룹 이름에 대한 올바른 태그가 있는지 확인합니다.
# Add or update tags for AKS name and AKS group name
az group update --name <node-resource-group-name> --set tags.AKS-Managed-Cluster-Name=<aks-managed-cluster-name> tags.AKS-Managed-Cluster-RG=<aks-managed-cluster-rg>
# Verify the tags
az group show --name <node-resource-group-name> --query "tags"
리소스 그룹을 모니터링하여 태그가 올바르게 적용되고 리소스 그룹이 예상대로 작동하는지 확인합니다.
원인 3: 클러스터 노드 리소스 그룹이 삭제됨
클러스터 노드 리소스 그룹을 삭제하면 클러스터에 필요한 인프라 리소스를 프로비전할 때 문제가 발생하여 클러스터 자동 크기 조정기가 실패합니다.
해결 방법: 구성을 변경하지 않고 클러스터를 목표 상태로 업데이트
이 문제를 해결하려면 다음 명령을 실행하여 삭제된 가상 머신 확장 집합 또는 태그(누락 또는 수정됨)를 복구할 수 있습니다.
참고 항목
작업이 완료될 때까지 몇 분 정도 걸릴 수 있습니다.
명령을 실행하기 전에 AKS 클러스터 리소스 그룹 및 클러스터 이름에 대한 환경 변수를 설정합니다. 반복 가능한 실행 중에 이름 충돌을 방지하기 위해 임의 접미사가 포함되어 있지만 리소스 그룹과 클러스터가 있는지 확인해야 합니다.
export RANDOM_SUFFIX=$(head -c 3 /dev/urandom | xxd -p)
export AKS_RG_NAME="MyAksResourceGroup$RANDOM_SUFFIX"
export AKS_CLUSTER_NAME="MyAksCluster$RANDOM_SUFFIX"
az aks update --resource-group $AKS_RG_NAME --name $AKS_CLUSTER_NAME --no-wait
도움을 요청하십시오.
질문이 있는 경우 Azure 커뮤니티 지원을 요청할 수 있습니다. Azure 피드백 커뮤니티에 제품 피드백을 제출할 수도 있습니다.