AKS 操作のトリアージ プラクティス

多くの場合、Azure Kubernetes Service (AKS) クラスターの根本原因分析は困難です。 このプロセスを簡略化するために、クラスター階層に基づくトップダウン アプローチを使用して問題をトリアージすることを検討してください。 クラスター レベルで開始し、必要に応じてドリルダウンします。

Diagram that shows the hierarchy of AKS cluster components: Cluster, node pools, nodes, pods, and containers.

次のセクションでは、トリアージ プラクティスに関するシリーズの概要を示し、トップダウン アプローチについて詳しく説明します。 これらの記事では、一連のツールとダッシュボードを使用する例を紹介します。 記事では、これらの例で問題の症状がどのように明らかにされるかを説明します。

このシリーズで取り組む一般的な問題は次のとおりです。

  • 不適切な構成によって発生するネットワークと接続の問題。
  • コントロール プレーンとノードの間の通信の切断。
  • 不十分なコンピューティング、メモリ、またはストレージ リソースによって発生する Kubelet の負荷。
  • ドメイン ネーム システム (DNS) の解決の問題。
  • ノードに 1 秒あたりのディスク入出力 (IOPS) 操作が不足している。
  • 受付制御パイプラインで API サーバーへの複数の要求がブロックされる。
  • クラスターに適切なコンテナー レジストリからプルするためのアクセス許可がない。

このシリーズは、特定の問題を解決することを目的としていません。 特定の問題のトラブルシューティングについては、AKS のトラブルシューティングに関するページを参照してください。

トリアージ プラクティスのシリーズ

手順 説明
1.AKS クラスターの正常性を評価する クラスターとネットワークの全体的な正常性を調べます。
2.ノードとポッドの正常性を調べる AKS ワーカー ノードの正常性を評価します。
3.ワークロードのデプロイを監視する すべてのデプロイと DaemonSet 機能が実行されていることを確認します。
4.受付コントローラーを検証する 受付コントローラーが想定どおりに動作しているかどうかを調べます。
5.コンテナー レジストリへの接続を検証する コンテナー レジストリへの接続を検証します。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパル作成者:

  • Kevin Harris | プリンシパル ソリューション スペシャリスト

その他の共同作成者:

公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。

次のステップ