Поделиться через


Автоматическое восстановление узла

Область применения: AKS в Azure Local 22H2, AKS на Windows Server

Чтобы свести к минимуму нарушения работы служб для кластеров, AKS, включенный Azure Arc, постоянно отслеживает состояние работоспособности рабочих узлов и выполняет автоматическое восстановление узлов, если возникают проблемы или если они становятся неработоспособными. В этой статье описывается, как AKS Arc проверяет наличие неработоспособных узлов и автоматически восстанавливает узлы Windows и Linux. В статье также показано, как вручную проверить работоспособность узла.

Как AKS проверяет наличие неработоспособных узлов

AKS Arc использует следующие правила, чтобы определить, является ли узел неработоспособным и требуется восстановить:

  • Узел сообщает о состоянии NotReady при последовательных проверках.
  • Узел не сообщает о состоянии в течение 20–30 минут.

Вы можете вручную проверить состояние работоспособности узлов kubectlследующим образом:

kubectl get nodes

Состояние узлов должно выглядеть следующим образом:

NAME              STATUS   ROLES    AGE   VERSION
moc-l2tlqojhk2d   Ready    master   46h   v1.19.7
moc-l8h8i6lxk1h   Ready    <none>   46h   v1.19.7
moc-lqnjufwo2cy   Ready    master   46h   v1.19.7
moc-ltyl8mqy47z   Ready    <none>   47h   v1.19.7
moc-lwn5xnrapnj   Ready    master   47h   v1.19.7
moc-wvt025q406z   Ready    <none>   47h   v1.19.7

Принцип работы автоматического восстановления

Если AKS Arc идентифицирует неработоспособный узел, который остается неработоспособным в течение более 20–30 минут, он создает и повторно создает новый узел.

Обычно для восстановления узла требуется от 20 до 30 минут. Если AKS Arc находит несколько неработоспособных узлов во время проверки работоспособности, каждый узел восстанавливается по отдельности перед началом другого восстановления.

Следующие шаги