AKS 作業的分級做法
Azure Kubernetes Service (AKS) 叢集的根本原因分析通常具有挑戰性。 若要簡化此程式,請考慮使用以叢集階層為基礎的由上至下方法來分級問題。 從叢集層級開始,並視需要向下切入。
下一節提供一系列有關分級做法的概觀,其中詳細說明由上而下的方法。 本文提供使用一組工具和儀表板的範例。 這些文章說明這些範例如何醒目提示問題的徵兆。
此系列中解決的常見問題包括:
- 設定不正確所造成的網路和連線問題。
- 控制平面與節點之間的通訊中斷。
- 由於計算、記憶體或儲存體資源不足所造成的 Kubelet 壓力。
- 網域名稱系統 (DNS) 解決問題。
- 每秒磁片輸入/輸出作業不足的節點(IOPS)。
- 許可控制管線,會封鎖對 API 伺服器的數個要求。
- 沒有許可權從適當的容器登錄提取的叢集。
此系列不適合解決特定問題。 如需疑難排解特定問題的相關資訊,請參閱 AKS 疑難排解 。
分級實務系列
步驟 | 描述 |
---|---|
1.評估 AKS 叢集健康情況 。 | 檢查叢集和網路的整體健康情況。 |
2.檢查節點和 Pod 健康情況 。 | 評估 AKS 背景工作節點的健康情況。 |
3.監視工作負載部署 。 | 確定所有部署和 DaemonSet 功能都在執行中。 |
4.驗證許可控制器 。 | 檢查許可控制器是否如預期般運作。 |
5.確認容器登錄 的連線。 | 確認容器登錄的連線。 |
參與者
本文由 Microsoft 維護。 原始投稿人如下。
主體作者:
- Kevin Harris |主要解決方案專家
其他投稿人:
- Paolo Salvatori |首席客戶工程師
- 法蘭西斯·西米·納紮雷斯 |資深技術專家
若要查看非公用LinkedIn設定檔,請登入LinkedIn。