次の方法で共有


ノードの自動修復

適用対象: Azure Local 22H2 上の AKS、Windows Server 上の AKS

クラスターのサービス中断を最小限に抑えるために、Azure Arc によって有効になっている AKS はワーカー ノードの正常性状態を継続的に監視し、問題が発生した場合や異常になった場合にノードの自動修復を実行します。 この記事では、AKS Arc が異常なノードをチェックし、Windows と Linux の両方のノードを自動的に修復する方法について説明します。 この記事では、ノードの正常性を手動で確認する方法も示します。

正常ではないノードを AKS で確認する方法

AKS Arc では、次のルールを使用して、ノードが異常であり、修復が必要かどうかを判断します。

  • 連続的なチェックで NotReady 状態がノードから報告される。
  • ノードは、20 ~ 30 分以内に状態を報告しません。

次のように、 kubectlを使用してノードの正常性状態を手動で確認できます。

kubectl get nodes

ノードの状態は、次の出力のようになります。

NAME              STATUS   ROLES    AGE   VERSION
moc-l2tlqojhk2d   Ready    master   46h   v1.19.7
moc-l8h8i6lxk1h   Ready    <none>   46h   v1.19.7
moc-lqnjufwo2cy   Ready    master   46h   v1.19.7
moc-ltyl8mqy47z   Ready    <none>   47h   v1.19.7
moc-lwn5xnrapnj   Ready    master   47h   v1.19.7
moc-wvt025q406z   Ready    <none>   47h   v1.19.7

自動修復のしくみ

AKS Arc は、20 ~ 30 分を超えて異常なままの異常なノードを識別すると、新しいノードを作成して再イメージ化します。

通常、ノードの修復には 20 ~ 30 分かかります。 AKS Arc が正常性チェック中に複数の異常なノードを検出した場合、各ノードは、別の修復が開始される前に個別に修復されます。

次のステップ