Azure Operator Nexus 監視

Operator Nexus 監視フレームワークは、オンプレミス インスタンスに関する運用の分析情報を提供します。 このフレームワークでは、運用上の (プラットフォームとワークロードの) データとメトリックのログ、監視、アラート (LMA) と分析、視覚化がサポートされています。

Screenshot of Operator Nexus Logging, Monitoring and Alerting (LMA) Framework.

図: Operator Nexus ログ、監視、アラート (LMA) フレームワーク

Operator Nexus 監視フレームワークの最重要点は以下のとおりです。

  • 一元化されたデータ収集: Operator Nexus 監視ソリューションは、中央の場所へのすべてのデータの収集に基づいています。 この場所では、すべてのオンプレミス インスタンスからの監視データを確認できます。
  • 明確に定義されたテスト済みのツール: このソリューションは、クラウドとオンプレミスのインスタンスからのテレメトリ データの収集、分析、処理を行う Azure Monitor に依存しています。
  • 学習と使用が容易: このソリューションでは、クラウドとオンプレミスのインスタンス内またはその全体からデータを検索する機能を使用して、簡単に問題の分析とデバッグを行えます。
  • 視覚化ツール: ニーズに合わせてカスタマイズしたダッシュボードとブックを作成します。
  • 統合アラート ツール: カスタムのしきい値に基づいてアラートを作成します。 アラート テンプレートを作成して、すべてのインスタンスにわたって再利用できます。

この記事は、以下のようにコンポーネントのスタックで構成される Operator Nexus 監視フレームワークを理解するのに役立ちます。

  • Azure Monitor は、Operator Nexus コンポーネントからログ データを収集して集計します
  • Azure Log Analytics ワークスペース (LAW) は、複数の Azure サブスクリプションとテナントからログ データを収集して集計します
  • 集計されたログ データに対しては分析、視覚化、およびアラートが実行されます。

プラットフォーム監視

Operator Nexus は、インフラストラクチャ リソースで構成されるデプロイのパフォーマンスの可視性を提供します。 これらのプラットフォーム リソースからログとメトリックを収集して分析する必要があります。 集計されていないデータと比較して、すべてのソースからのデータの一元的な収集と集計からは貴重な分析情報が得られます。

これらのログとメトリックは、プラットフォームの状態を監視するために使用されます。 パフォーマンスを確認し、何に問題があるかを分析できます。 状況の原因を分析できます。 視覚化は、必要なアラートとその条件を構成するのに役立ちます。 たとえば、リソースが異常な動作をしているとき、またはしきい値に達したときに生成されるアラートを構成できます。 収集されたログと分析を使用して、環境内の何らかの問題をデバッグできます。

監視データ

Operator Nexus 監視では、他の Azure リソースと同じ種類のデータを収集できます。 各インスタンスから収集されたデータは、LAW で表示できます。

Azure リソースの監視については、こちらで学習できます。

収集とルーティング

Operator Nexus 監視では、各インフラストラクチャ リソースからデータを収集できます。 インフラストラクチャ コンポーネントのセットには、以下が含まれます。

  • CE、TOR、NPB、管理スイッチ、ターミナル サーバーを含むネットワーク ファブリック。
  • ベア メタル サーバーを含むコンピューティング。
  • アンダークラウド コントロール プレーン (プラットフォーム全体のデプロイとライフサイクルの管理を担当する Kubernetes クラスター)。

これらのレイヤーからのログ データの収集は、Operator Nexus インスタンスの作成時に既定で有効になります。 これらの収集されたログは、Azure Monitor LAW にルーティングされます。

コンテナー化および仮想化されたネットワーク機能を実行するために作成されたテナント レイヤーからデータを収集することもできます。 収集できるログ データには、以下が含まれます。

  • (VNF または CNF ワークロードに使用される) Virtual Machines からの syslog の収集。
  • Kubernetes クラスターとその上にデプロイされたアプリケーションからのログの収集。

テナント Kubernetes クラスターと Virtual Machines からのログの収集を有効にする必要があります。 Azure 監視エージェントをデプロイするための手順に従う必要があります。 データは Azure LAW で収集されます。

Operator Nexus ログの保存

Azure Monitor ログのデータはテーブルに格納され、各テーブルには独自の一意のプロパティ セットがあります。

Azure Monitor 内のすべてのリソース ログは、サービス固有のフィールドが後に続く同一フィールドを持ちます。共通スキーマを参照してください。

Operator Nexus プラットフォームからのログは、以下のテーブルに保存されます。

テーブル 説明
syslog Log Analytics エージェントを使用している Linux コンピューター上の syslog イベント
ContainerInventory 各コンテナーの詳細と現在の状態。
ContainerLog コンテナーの stdout ストリームと stderr ストリームから収集されたログ行
ContainerNodeInventory コンテナー ホストとして機能するノードの詳細。
InsightMetrics サーバー、K8、コンテナーから収集されたメトリック。
KubeEvents Kubernetes イベントとそのプロパティ。
KubeMonAgentEvents Azure Monitor Kubernetes エージェントによってログに記録されたエラーと警告に関するイベント。
KubeNodeInventory Kubernetes クラスターの一部であるノードの詳細
KubePodInventory Kubernetes ポッドとそのプロパティ
KubePVInventory Kubernetes 永続ボリュームとそのプロパティ。
KubeServices Kubernetes サービスとそのプロパティ
Heartbeat エージェントの正常性を報告するために、Log Analytics エージェントによって 1 分ごとにログに記録されたレコード

Operator Nexus メトリック

ログ セクションの 'InsightMetrics' テーブルには、ベア メタル マシンとアンダークラウド Kubernetes クラスターから収集されたメトリックが含まれています。 さらに、Azure Monitor メニューから [メトリック] タブを開くことで、アンダークラウドから収集されたメトリックをいくつか選択して確認できます。

Screenshot of Azure Monitor Metrics Selection.

図: Azure Monitor メトリックの選択

このツールの使用方法の詳細については、「Azure Monitor メトリックス エクスプローラーでメトリックスを分析する」を参照してください。

Workbooks

ブックは、テキスト、ログ クエリ、メトリック、データ分析用のパラメーターとさまざまな種類のリッチな視覚化の作成を組み合わせます。 Operator Nexus のログと監視用のサンプル Azure Resource Manager ブック テンプレートを使用して、Azure LAW 内に Azure ブックをデプロイできます。

警告

Operator Nexus アラート ルール用のサンプル Azure Resource Manager アラーム テンプレートを使用できます。 アラートのしきい値と条件を指定する必要があります。 その後、これらのアラート テンプレートをオンプレミス環境にデプロイできます。

Log Analytics ワークスペース

Log Analytics ワークスペース (LAW) は、Azure Monitor やその他の Azure サービスからのデータをログ記録するための固有の環境です。 各ワークスペースには専用のデータ リポジトリと構成がありますが、複数のサービスのデータを結合できます。 各ワークスペースは、複数のデータ テーブルで構成されます。

単一の LAW を作成して、Operator の要件に基づいて、すべての関連データまたは複数のワークスペースを収集できます。