Azure Monitor を使用して Kubernetes を監視するためのベストプラクティス

2025-04-18

この記事では、Azure Kubernetes Service (AKS) と Azure Arc 対応 Kubernetes クラスターの正常性とパフォーマンスを監視するためのベストプラクティスについて説明します。このガイダンスは、Azure Well-Architected Framework で説明されているアーキテクチャエクセレンスの 5 つの柱に基づいています。

信頼性

クラウドでは、障害が発生することを認識しています。目標は、障害がまったく発生しないように努力することではなく、障害が発生した単一コンポーネントの影響を最小限に抑えることです。 Kubernetes クラスターと監視環境の信頼性を確保するには、次の情報を使用します。

設計チェックリスト

クラスターに対して Prometheus メトリックのスクレイピングを有効にする。
クラスターからログとパフォーマンスデータを収集するために Container Insights を有効にする。
診断設定を作成して、AKS クラスターのコントロールプレーンログを収集する。
推奨される Prometheus アラートを有効にする。
Container Insights をサポートする Log Analytics ワークスペースの可用性を確保する。

構成に関する推奨事項

勧告	メリット
クラスターに対して Prometheus メトリックのスクレイピングを有効にする。	Prometheus 環境がまだない場合は、Prometheus 用の Azure Monitor マネージドサービスを使用して、クラスターで Prometheus を有効にします。 Azure Managed Grafana を使用して、収集された Prometheus データを分析します。既定の構成を超えて追加のメトリックを収集する場合は、「Prometheus 用 Azure Monitor マネージドサービスで Prometheus メトリックのスクレイピングをカスタマイズする」を参照してください。
クラスターからログとパフォーマンスデータを収集するために Container Insights を有効にする。	Container Insights では、クラスター内の各ノードから stdout/stderr ログ、パフォーマンスメトリック、および Kubernetes イベントが収集されます。ノードやその他のコンポーネントの可用性など、このデータを分析するためのダッシュボードとレポートが提供されます。 Log Analytics を使用して、収集したログの可用性エラーを特定します。
診断設定を作成して、AKS クラスターのコントロールプレーンログを収集する。	AKS では、Azure Monitor のリソースログとしてコントロールプレーンログが実装されます。診断設定を作成して、これらのログを Log Analytics ワークスペースに送信し、ログクエリを使って可用性に影響するエラーや問題を特定できるようにします。
推奨される Prometheus アラートを有効にする。	Azure Monitor のアラートにより、問題が検出されたときに事前に通知されます。クラスターで最も一般的な可用性とパフォーマンスの問題を検出する一連の推奨される Prometheus アラートルールから始めます。 Container Insights によって収集されたデータを使用して、ログ検索アラートを追加する可能性があります。
Container Insights をサポートする Log Analytics ワークスペースの可用性を確保する。	Container Insights は、Log Analytics ワークスペースに依存します。ワークスペースの信頼性を確保するための推奨事項については、「Azure Monitor ログのベストプラクティス」を参照してください。

安全

セキュリティは、あらゆるアーキテクチャの最も重要な側面の 1 つです。 Azure Monitor は、最小限の特権の原則と多層防御の両方を採用する機能を提供します。 Kubernetes クラスターを監視し、確実に許可されているユーザーのみが収集されたデータにアクセスできるようにするには、次の情報を使用します。

マネージド ID 認証を使用してクラスターを Container insights に接続する

マネージド ID 認証は、新しいクラスターの既定の認証方法です。レガシ認証を使用している場合は、マネージド ID に移行して、証明書ベースのローカル認証を削除します。

手順: マネージド ID 認証に移行する

Azure プライベートリンクを使用してプライベートエンドポイントを介してクラスターから Azure Monitor にデータを送信する

Prometheus 用の Azure マネージドサービスは、既定でパブリックエンドポイントを使用する Azure Monitor ワークスペースにデータを格納します。 Microsoft は、エンドツーエンドの暗号化を使用してパブリックエンドポイントへの接続をセキュリティで保護します。プライベートエンドポイントが必要な場合は、 Azure プライベートリンクを使用して、クラスターが承認されたプライベートネットワークを介してワークスペースに接続できるようにします。プライベートリンクを使用して、ExpressRoute または VPN 経由でワークスペースデータを強制的に取り込むこともできます。

手順: プライベートリンク用にクラスターを構成する方法の詳細については、 Azure Monitor での Kubernetes 監視のプライベートリンクの有効化に関するページを参照してください。プライベートリンクを使用したデータのクエリの詳細については、「マネージド Prometheus と Azure Monitor ワークスペースにプライベートエンドポイントを使用する」を参照してください。

トラフィック分析を使用してクラスターとの間のネットワークトラフィックを監視する

トラフィック分析では、Azure Network Watcher NSG のフローログを分析して、Azure クラウドでのトラフィックフローに関する分析情報を提供します。このツールを使用して、クラスターのデータ流出がないことを確かめ、不要なパブリック IP が公開されているかどうかを検出します。

ネットワーク監視を有効にする

AKS のNetwork Observability アドオンでは、Kubernetes ネットワークスタック内の複数のレイヤーにわたって監視することができます。クラスター内のサービス間のアクセス (東西トラフィック) を監視および観察します。

手順: Azure Kubernetes Service (AKS) の Container Network Observability を設定する

Log Analytics ワークスペースをセキュリティで保護する

コンテナー分析情報は、Log Analytics ワークスペースにデータを送信します。 Log Analytics ワークスペース内のログインジェストとストレージをセキュリティで保護してください。

手順: ログの取り込みと保存。

コストの最適化

コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法のことです。さまざまな構成オプションと、収集するデータの量を減らす機会を理解することで、Azure Monitor のコストを大幅に削減できます。「Azure Monitor のコストと使用量」を参照して、Azure Monitor が請求するさまざまな方法と、毎月の請求書を表示する方法を理解しておいてください。

注

Azure Monitor のすべての機能にわたるコスト最適化の推奨事項については、「Azure Monitor でコストを最適化する」を参照してください。

設計チェックリスト

Prometheus 用の Azure Monitor マネージドサービスを使用してメトリックの収集を有効にする。
Container Insights でデータ収集を変更するようにエージェント収集を構成する。
Container Insights によるメトリックデータの収集の設定を変更する。
Azure portal で Container Insights エクスペリエンスを使用しない場合は、メトリックデータの Container Insights 収集を無効にする。
コンテナーログテーブルに対して定期的にクエリを実行しない場合、またはアラートに使用しない場合は、基本ログとして構成する。
必要のないリソースログの収集を制限する。
AKS リソースログにはリソース固有のログを使用し、テーブルを基本ログとして構成する。
OpenCost を使用して、Kubernetes のコストに関する詳細を収集する。

構成に関する推奨事項

勧告	メリット
Prometheus 用の Azure Monitor マネージドサービスを使用してメトリックの収集を有効にする。また、Prometheus メトリックを Log Analytics ワークスペースに送信しないことにも注意してください。	マネージド Prometheus を有効にすることで、Prometheus 用の Azure Monitor マネージドサービスを使用して、クラスターから Prometheus メトリックをスクレイピングできます。 Log Analytics ワークスペース内で Prometheus メトリックを収集するように Container Insights を構成できますが、これはマネージド Prometheus 内のデータと冗長になり追加コストが発生するため、お勧めしないことに留意してください。詳細については、マネージド Prometheus の価格を参照してください。
Container Insights でデータ収集を変更するようにエージェントを構成する。	「Container Insights 監視コストを最適化する」の説明に従って Container insights により収集されたデータを分析し、必要のないデータの収集を停止するように構成を調整します。
Container Insights によるメトリックデータの収集の設定を変更する。	メトリックデータが収集される頻度と Container Insights によって収集される名前空間の両方を変更する方法の詳細については、「コスト最適化設定を有効にする」を参照してください。
Azure portal で Container Insights エクスペリエンスを使用しない場合は、メトリックデータの Container Insights 収集を無効にする。	Container Insights では、マネージド Prometheus と同じメトリック値の多くが収集されます。これらのメトリックの収集を無効にするには、「Container insights でコスト最適化設定を有効にする」の説明に従って、ログとイベントのみを収集するようにコンテナー分析情報を構成します。この構成により、Azure portal でのコンテナー分析情報のエクスペリエンスは無効になりますが、Grafana を使用して Prometheus メトリックを視覚化し、Log Analytics を使用してコンテナー分析情報によって収集されたログデータを分析できます。
コンテナーログテーブルに対して定期的にクエリを実行しない場合、またはアラートに使用しない場合は、基本ログとして構成する。	Container Insights スキーマを ContainerLogV2 に変換します。これは基本ログと互換性があり、「Container Insights 監視コストを最適化する」で説明されているように、大幅なコスト削減を実現できます。
必要のないリソースログの収集を制限する。	AKS クラスターのコントロールプレーンのログは、Azure Monitor のリソースログとして実装されています。このデータを Log Analytics ワークスペースに送信するには、診断設定を作成します。収集する必要があるカテゴリに関する推奨事項については、「AKS クラスターのコントロールプレーンログを収集する」を参照してください。
AKS リソースログにはリソース固有のログを使用し、テーブルを基本ログとして構成する。	AKS では、リソースログに対して Azure 診断モードまたはリソース固有モードがサポートされています。リソースログを指定し、基本ログのテーブルを構成するオプションを有効にします。これにより、場合によってはクエリを実行するだけでアラートに使用しないログのインジェスト料金が削減されます。
OpenCost を使用して、Kubernetes のコストに関する詳細を収集する。	OpenCost は、Kubernetes のコストを理解し、AKS のコストを可視化する機能をサポートするための、ベンダーに依存しないオープンソースの CNCF サンドボックスプロジェクトです。顧客固有の Azure 価格に加えて、詳細なコスト計算データを Azure Storage にエクスポートして、クラスター管理者がコストを分析および分類するのを支援します。

オペレーショナルエクセレンス

オペレーショナルエクセレンスとは、運用環境でサービスを確実に実行するために必要な運用プロセスを指します。 Kubernetes クラスターを監視するための運用要件を最小限に抑えるには、次の情報を使用します。

設計チェックリスト

Kubernetes 環境のすべてのレイヤーを監視するためのガイダンスを確認する。
Azure Arc 対応 Kubernetes を使用して、Azure 外部のクラスターを監視する。
クラウドネイティブツールには Azure マネージドサービスを使用する。
AKS クラスターを既存の監視ツールに統合する。
Azure Policy を使用して、Kubernetes クラスターからのデータ収集を有効にする。

構成に関する推奨事項

勧告	メリット
Kubernetes 環境のすべてのレイヤーを監視するためのガイダンスを確認する。	「Container insights を使用して Kubernetes クラスターのパフォーマンスを監視する」には、ネットワーク、クラスター、アプリケーションレイヤーから Kubernetes 環境全体を監視するためのガイダンスとベストプラクティスが含まれています。
Azure Arc 対応 Kubernetes を使用して、Azure 外部のクラスターを監視する。	Azure Arc 対応 Kubernetes を使用すると、他のクラウドで実行されている Kubernetes クラスターを、Container Insights や Prometheus 用 Azure Monitor マネージドサービスなど、AKS クラスターと同じツールを使用して監視できます。
クラウドネイティブツールには Azure マネージドサービスを使用する。	Prometheus 用の Azure Monitor マネージドサービスと Azure マネージド Grafanaでは、基になるインフラストラクチャを運用しなくても、クラウドネイティブツール Prometheus と Grafana のすべての機能がサポートされます。これらのツールをすばやくプロビジョニングし、最小限のオーバーヘッドで Kubernetes クラスターをオンボードできます。これらのサービスを使用すると、コミュニティルールとダッシュボードの広範なライブラリにアクセスして、Kubernetes 環境を監視できます。
AKS クラスターを既存の監視ツールに統合する。	Prometheus と Grafana に既に投資している場合は、「Azure サービスとクラウドネイティブツールを使用して Kubernetes クラスターを監視する」のガイダンスを使用して、AKS クラスターと Azure マネージドサービスを既存の環境に統合します。
Azure Policy を使用して、Kubernetes クラスターからのデータ収集を有効にする。	Azure Policy を使用して、Prometheus メトリック、Container Insights、診断設定を有効にするためのデータ収集を有効にします。これにより、新しいクラスターが自動的に監視され、その監視構成が適用されます。

パフォーマンス効率

パフォーマンス効率とは、ユーザーからの要求に合わせて効率的な方法でワークロードをスケーリングできることです。次の情報を使用して、Kubernetes クラスターのパフォーマンスを監視し、パフォーマンスを最大限に高めるために構成されていることを確かめます。

設計チェックリスト

クラスターの Prometheus メトリックの収集を有効にする。
Container Insights を有効にして、クラスターのパフォーマンスを追跡する。
推奨される Prometheus アラートを有効にする。

構成に関する推奨事項

勧告	メリット
クラスターの Prometheus メトリックの収集を有効にする。	Prometheus は、Cloud Native Compute Foundation のクラウドネイティブメトリックソリューションで、Kubernetes クラスターからメトリックデータを収集して分析するために使用される最も一般的なツールです。 Prometheus 環境がまだない場合は、Prometheus 用の Azure Monitor マネージドサービスを使用して、クラスターで Prometheus を有効にします。 Azure Managed Grafana を使用して、収集された Prometheus データを分析します。既定の構成を超えて追加のメトリックを収集する場合は、「Prometheus 用 Azure Monitor マネージドサービスで Prometheus メトリックのスクレイピングをカスタマイズする」を参照してください。
Container Insights を有効にして、クラスターのパフォーマンスを追跡する。	Kubernetes クラスターに対して Container Insights を有効にした場合、ビューとブックを使用して、クラスターのコンポーネントのパフォーマンスを追跡できます。このデータは、Prometheus によって収集されたデータと重複する可能性があります。コストに関する推奨事項については、「コストの最適化」を参照してください。
推奨される Prometheus アラートを有効にする。	Azure Monitor のアラートにより、問題が検出されたときに事前に通知されます。クラスターで最も一般的な可用性とパフォーマンスの問題を検出する一連の推奨される Prometheus アラートルールから始めます。 Container Insights によって収集されたデータを使用して、ログ検索アラートを追加する可能性があります。

次のステップ

Azure Monitor の概要について詳しくは、こちらをご覧ください。

次の方法で共有

Azure Monitor を使用して Kubernetes を監視するためのベスト プラクティス

信頼性

設計チェックリスト

構成に関する推奨事項

安全

マネージド ID 認証を使用してクラスターを Container insights に接続する

Azure プライベート リンクを使用してプライベート エンドポイントを介してクラスターから Azure Monitor にデータを送信する

トラフィック分析を使用してクラスターとの間のネットワーク トラフィックを監視する

ネットワーク監視を有効にする

Log Analytics ワークスペースをセキュリティで保護する

コストの最適化

設計チェックリスト

構成に関する推奨事項

オペレーショナルエクセレンス

設計チェックリスト

構成に関する推奨事項

パフォーマンス効率

設計チェックリスト

構成に関する推奨事項

次のステップ

フィードバック

その他のリソース

Azure Monitor を使用して Kubernetes を監視するためのベストプラクティス

Azure プライベートリンクを使用してプライベートエンドポイントを介してクラスターから Azure Monitor にデータを送信する

トラフィック分析を使用してクラスターとの間のネットワークトラフィックを監視する