Автоматическое восстановление узла
Область применения: AKS в Azure Local 22H2, AKS на Windows Server
Чтобы свести к минимуму нарушения работы служб для кластеров, AKS, включенный Azure Arc, постоянно отслеживает состояние работоспособности рабочих узлов и выполняет автоматическое восстановление узлов, если возникают проблемы или если они становятся неработоспособными. В этой статье описывается, как AKS Arc проверяет наличие неработоспособных узлов и автоматически восстанавливает узлы Windows и Linux. В статье также показано, как вручную проверить работоспособность узла.
Как AKS проверяет наличие неработоспособных узлов
AKS Arc использует следующие правила, чтобы определить, является ли узел неработоспособным и требуется восстановить:
- Узел сообщает о состоянии NotReady при последовательных проверках.
- Узел не сообщает о состоянии в течение 20–30 минут.
Вы можете вручную проверить состояние работоспособности узлов kubectl
следующим образом:
kubectl get nodes
Состояние узлов должно выглядеть следующим образом:
NAME STATUS ROLES AGE VERSION
moc-l2tlqojhk2d Ready master 46h v1.19.7
moc-l8h8i6lxk1h Ready <none> 46h v1.19.7
moc-lqnjufwo2cy Ready master 46h v1.19.7
moc-ltyl8mqy47z Ready <none> 47h v1.19.7
moc-lwn5xnrapnj Ready master 47h v1.19.7
moc-wvt025q406z Ready <none> 47h v1.19.7
Принцип работы автоматического восстановления
Если AKS Arc идентифицирует неработоспособный узел, который остается неработоспособным в течение более 20–30 минут, он создает и повторно создает новый узел.
Обычно для восстановления узла требуется от 20 до 30 минут. Если AKS Arc находит несколько неработоспособных узлов во время проверки работоспособности, каждый узел восстанавливается по отдельности перед началом другого восстановления.