針對節點未就緒失敗進行疑難解答,這些失敗會接著復原

本文有助於疑難解答 Microsoft Azure Kubernetes Service (AKS 叢集內的節點) 顯示節點未就緒狀態,但會自動復原為狀況良好的狀態。

徵狀

您會注意到,當節點報告其狀態為 [尚未就緒] 時,您的應用程式會停止回應。 不過,節點會自動復原,而現在,它正在尋找 RCA) (根本原因分析。

原因

此問題的可能原因包括下列案例:

  • API 伺服器無法使用,而且您正在使用整備探查進行部署。

    如果 Pod 正在執行但尚未就緒,則此情況表示整備探查失敗。 如果整備探查失敗,Pod 就不會附加至服務,而且流量不會轉送到 Pod 實例。

  • 發生虛擬機 (VM) 主機錯誤。 若要判斷 VM 主機是否發生錯誤,請檢查下列資訊來源:

預防

若要防止未來發生此問題,請採取下列一或多個動作:

  • 請確定您的服務層級已完全付費。
  • 減少對 API 伺服器的 watchget 要求數目。
  • 將節點集區取代為狀況良好的節點集區。

其他相關資訊