다음을 통해 공유


복구가 이어지는 노드 준비 안 됨 오류 문제 해결

이 문서에서는 AKS(Azure Kubernetes Service) 클러스터의 노드 준비 안 함 문제를 해결하고 해결하는 가이드를 제공합니다. 노드가 "NotReady" 상태가 되면 애플리케이션의 기능이 중단되고 응답이 중지될 수 있습니다. 일반적으로 노드는 짧은 기간 후에 자동으로 복구됩니다. 그러나 반복되는 문제를 방지하고 안정적인 환경을 유지하려면 효과적인 해결 방법을 구현할 수 있는 근본 원인을 이해하는 것이 중요합니다.

원인

"NotReady" 상태가 발생할 수 있는 몇 가지 시나리오가 있습니다.

  • API 서버를 사용할 수 없습니다. 이로 인해 준비 프로브가 실패합니다. 이렇게 하면 트래픽이 더 이상 Pod 인스턴스로 전달되지 않도록 Pod가 서비스에 연결되지 않습니다.

  • VM(가상 머신) 호스트 오류입니다. VM 호스트 오류가 발생했는지 여부를 확인하려면 다음 정보 원본을 확인합니다.

해결 방법

이 문제를 해결하려면 다음 단계를 수행합니다.

  1. 노드 상태에 대한 세부 정보를 검토하려면 실행 kubectl describe node <node-name> 합니다. 문제의 근본 원인을 나타낼 수 있는 오류 메시지 또는 경고를 찾습니다.
  2. 명령을 실행하여 API 서버 가용성을 확인합니다 kubectl get apiservices . 준비 상태 프로브가 배포 YAML 파일에서 올바르게 구성되었는지 확인합니다.
  3. 노드의 네트워크 구성을 확인하여 연결 문제가 없는지 확인합니다.
  4. CPU, 메모리 및 디스크와 같은 노드의 리소스 사용량을 확인하여 잠재적인 제약 조건을 식별합니다. 자세한 내용은 컨테이너 인사이트를 사용하여 Kubernetes 클러스터 성능 모니터링을 참조하세요.

추가 단계는 노드 준비 안 됨 오류의 기본 문제 해결을 참조 하세요.

방지

나중에 이 문제가 발생하지 않도록 하려면 다음 작업 중 하나 이상을 수행합니다.

  • 서비스 계층이 완전히 지불되었는지 확인합니다.
  • API 서버에 대한 요청 수 watchget 수를 줄입니다.