Automatyczna naprawa węzła
Dotyczy: AKS w Azure Local 22H2, AKS w systemie Windows Server
Aby zminimalizować przerwy w działaniu usługi dla klastrów, usługa AKS włączona przez usługę Azure Arc stale monitoruje stan kondycji węzłów roboczych i wykonuje automatyczną naprawę węzła, jeśli wystąpią problemy lub gdy staną się w złej kondycji. W tym artykule opisano, jak usługa AKS Arc sprawdza węzły w złej kondycji i automatycznie naprawia węzły systemów Windows i Linux. W tym artykule pokazano również, jak ręcznie sprawdzić kondycję węzła.
Jak usługa AKS sprawdza, czy węzły są w złej kondycji
Usługa AKS Arc używa następujących reguł, aby określić, czy węzeł jest w złej kondycji i wymaga naprawy:
- Węzeł zgłasza stan NotReady podczas kolejnych testów.
- Węzeł nie zgłasza żadnego stanu w ciągu 20–30 minut.
Stan kondycji węzłów można sprawdzić ręcznie za pomocą kubectl
polecenia w następujący sposób:
kubectl get nodes
Stan węzłów powinien wyglądać podobnie do następujących danych wyjściowych:
NAME STATUS ROLES AGE VERSION
moc-l2tlqojhk2d Ready master 46h v1.19.7
moc-l8h8i6lxk1h Ready <none> 46h v1.19.7
moc-lqnjufwo2cy Ready master 46h v1.19.7
moc-ltyl8mqy47z Ready <none> 47h v1.19.7
moc-lwn5xnrapnj Ready master 47h v1.19.7
moc-wvt025q406z Ready <none> 47h v1.19.7
Jak działa automatyczna naprawa
Jeśli usługa AKS Arc identyfikuje węzeł w złej kondycji, który pozostaje w złej kondycji przez ponad 20–30 minut, tworzy i odtwarza nowy węzeł.
Naprawa węzła zwykle trwa od 20 do 30 minut. Jeśli usługa AKS Arc znajdzie wiele węzłów w złej kondycji podczas sprawdzania kondycji, każdy węzeł zostanie naprawiony indywidualnie przed rozpoczęciem kolejnej naprawy.