針對節點未就緒失敗進行疑難解答,這些失敗會接著復原
本文有助於疑難解答 Microsoft Azure Kubernetes Service (AKS 叢集內的節點) 顯示節點未就緒狀態,但會自動復原為狀況良好的狀態。
徵狀
您會注意到,當節點報告其狀態為 [尚未就緒] 時,您的應用程式會停止回應。 不過,節點會自動復原,而現在,它正在尋找 RCA) (根本原因分析。
原因
此問題的可能原因包括下列案例:
API 伺服器無法使用,而且您正在使用整備探查進行部署。
如果 Pod 正在執行但尚未就緒,則此情況表示整備探查失敗。 如果整備探查失敗,Pod 就不會附加至服務,而且流量不會轉送到 Pod 實例。
發生虛擬機 (VM) 主機錯誤。 若要判斷 VM 主機是否發生錯誤,請檢查下列資訊來源:
預防
若要防止未來發生此問題,請採取下列一或多個動作:
- 請確定您的服務層級已完全付費。
- 減少對 API 伺服器的
watch
和get
要求數目。 - 將節點集區取代為狀況良好的節點集區。
其他相關資訊
- 如需一般疑難解答步驟,請參閱 節點未就緒失敗的基本疑難解答。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應