Rozwiązywanie problemów z niepowodzeniami braku gotowości węzła, po których następuje odzyskiwanie

Ten artykuł ułatwia rozwiązywanie problemów ze scenariuszami, w których węzeł w klastrze usługi Microsoft Azure Kubernetes Service (AKS) pokazuje stan Nie gotowe węzła, ale następnie automatycznie odzyskuje stan w dobrej kondycji.

Symptomy

Zauważysz, że aplikacja przestaje odpowiadać, gdy węzeł zgłasza, że ma stan Nie gotowe. Jednak węzeł jest przywracany automatycznie, a teraz szuka analizy głównej przyczyny (RCA).

Przyczyna

Możliwe przyczyny tego problemu obejmują następujące scenariusze:

  • Serwer interfejsu API jest niedostępny i używasz sondy gotowości do wdrożenia.

    Jeśli zasobnik jest uruchomiony, ale nie jest gotowy, oznacza to, że sonda gotowości kończy się niepowodzeniem. Jeśli sonda gotowości nie powiedzie się, zasobnik nie jest dołączony do usługi i ruch nie jest przekazywany do wystąpienia zasobnika.

  • Występują błędy hosta maszyny wirtualnej. Aby ustalić, czy wystąpiły błędy hosta maszyny wirtualnej, sprawdź następujące źródła informacji:

Zapobiegania

Aby zapobiec wystąpieniu tego problemu w przyszłości, wykonaj co najmniej jedną z następujących akcji:

  • Upewnij się, że warstwa usługi jest w pełni płatna.
  • Zmniejsz liczbę watch żądań i get do serwera interfejsu API.
  • Zastąp pulę węzłów pulą węzłów w dobrej kondycji.

Więcej informacji