AKS 作業的分級做法

Azure Kubernetes Service (AKS) 叢集的根本原因分析通常具有挑戰性。 若要簡化此程式,請考慮使用以叢集階層為基礎的由上至下方法來分級問題。 從叢集層級開始,並視需要向下切入。

Diagram that shows the hierarchy of AKS cluster components: Cluster, node pools, nodes, pods, and containers.

下一節提供一系列有關分級做法的概觀,其中詳細說明由上而下的方法。 本文提供使用一組工具和儀表板的範例。 這些文章說明這些範例如何醒目提示問題的徵兆。

此系列中解決的常見問題包括:

  • 設定不正確所造成的網路和連線問題。
  • 控制平面與節點之間的通訊中斷。
  • 由於計算、記憶體或儲存體資源不足所造成的 Kubelet 壓力。
  • 網域名稱系統 (DNS) 解決問題。
  • 每秒磁片輸入/輸出作業不足的節點(IOPS)。
  • 許可控制管線,會封鎖對 API 伺服器的數個要求。
  • 沒有許可權從適當的容器登錄提取的叢集。

此系列不適合解決特定問題。 如需疑難排解特定問題的相關資訊,請參閱 AKS 疑難排解

分級實務系列

步驟 描述
1.評估 AKS 叢集健康情況 檢查叢集和網路的整體健康情況。
2.檢查節點和 Pod 健康情況 評估 AKS 背景工作節點的健康情況。
3.監視工作負載部署 確定所有部署和 DaemonSet 功能都在執行中。
4.驗證許可控制器 檢查許可控制器是否如預期般運作。
5.確認容器登錄 的連線。 確認容器登錄的連線。

參與者

本文由 Microsoft 維護。 原始投稿人如下。

主體作者:

其他投稿人:

若要查看非公用LinkedIn設定檔,請登入LinkedIn。

下一步