ノードの自動修復
適用対象: Azure Local 22H2 上の AKS、Windows Server 上の AKS
クラスターのサービス中断を最小限に抑えるために、Azure Arc によって有効になっている AKS はワーカー ノードの正常性状態を継続的に監視し、問題が発生した場合や異常になった場合にノードの自動修復を実行します。 この記事では、AKS Arc が異常なノードをチェックし、Windows と Linux の両方のノードを自動的に修復する方法について説明します。 この記事では、ノードの正常性を手動で確認する方法も示します。
正常ではないノードを AKS で確認する方法
AKS Arc では、次のルールを使用して、ノードが異常であり、修復が必要かどうかを判断します。
- 連続的なチェックで NotReady 状態がノードから報告される。
- ノードは、20 ~ 30 分以内に状態を報告しません。
次のように、 kubectl
を使用してノードの正常性状態を手動で確認できます。
kubectl get nodes
ノードの状態は、次の出力のようになります。
NAME STATUS ROLES AGE VERSION
moc-l2tlqojhk2d Ready master 46h v1.19.7
moc-l8h8i6lxk1h Ready <none> 46h v1.19.7
moc-lqnjufwo2cy Ready master 46h v1.19.7
moc-ltyl8mqy47z Ready <none> 47h v1.19.7
moc-lwn5xnrapnj Ready master 47h v1.19.7
moc-wvt025q406z Ready <none> 47h v1.19.7
自動修復のしくみ
AKS Arc は、20 ~ 30 分を超えて異常なままの異常なノードを識別すると、新しいノードを作成して再イメージ化します。
通常、ノードの修復には 20 ~ 30 分かかります。 AKS Arc が正常性チェック中に複数の異常なノードを検出した場合、各ノードは、別の修復が開始される前に個別に修復されます。