Udostępnij za pośrednictwem


Automatyczna naprawa węzła

Dotyczy: AKS w Azure Local 22H2, AKS w systemie Windows Server

Aby zminimalizować przerwy w działaniu usługi dla klastrów, usługa AKS włączona przez usługę Azure Arc stale monitoruje stan kondycji węzłów roboczych i wykonuje automatyczną naprawę węzła, jeśli wystąpią problemy lub gdy staną się w złej kondycji. W tym artykule opisano, jak usługa AKS Arc sprawdza węzły w złej kondycji i automatycznie naprawia węzły systemów Windows i Linux. W tym artykule pokazano również, jak ręcznie sprawdzić kondycję węzła.

Jak usługa AKS sprawdza, czy węzły są w złej kondycji

Usługa AKS Arc używa następujących reguł, aby określić, czy węzeł jest w złej kondycji i wymaga naprawy:

  • Węzeł zgłasza stan NotReady podczas kolejnych testów.
  • Węzeł nie zgłasza żadnego stanu w ciągu 20–30 minut.

Stan kondycji węzłów można sprawdzić ręcznie za pomocą kubectlpolecenia w następujący sposób:

kubectl get nodes

Stan węzłów powinien wyglądać podobnie do następujących danych wyjściowych:

NAME              STATUS   ROLES    AGE   VERSION
moc-l2tlqojhk2d   Ready    master   46h   v1.19.7
moc-l8h8i6lxk1h   Ready    <none>   46h   v1.19.7
moc-lqnjufwo2cy   Ready    master   46h   v1.19.7
moc-ltyl8mqy47z   Ready    <none>   47h   v1.19.7
moc-lwn5xnrapnj   Ready    master   47h   v1.19.7
moc-wvt025q406z   Ready    <none>   47h   v1.19.7

Jak działa automatyczna naprawa

Jeśli usługa AKS Arc identyfikuje węzeł w złej kondycji, który pozostaje w złej kondycji przez ponad 20–30 minut, tworzy i odtwarza nowy węzeł.

Naprawa węzła zwykle trwa od 20 do 30 minut. Jeśli usługa AKS Arc znajdzie wiele węzłów w złej kondycji podczas sprawdzania kondycji, każdy węzeł zostanie naprawiony indywidualnie przed rozpoczęciem kolejnej naprawy.

Następne kroki