Operations Manager の基本概念
適用対象: System Center 2012 R2 Operations Manager,System Center 2012 - Operations Manager,System Center 2012 SP1 - Operations Manager
Microsoft System Center 2012 の 1 つのコンポーネントである Operations Manager は、1 つのコンソールから多数のコンピューターのサービス、デバイス、および操作を監視できるソフトウェアです。 このトピックでは、Operations Manager インフラストラクチャを管理する管理者、および企業内のコンピューターを監視およびサポートするオペレーターを対象に、Operations Manager の基本的な概念について説明します。
Operations Manager の機能
企業の多くは、その規模にかかわらず、ほとんどの業務をコンピューター環境で提供されるサービスやアプリケーションに依存しています。 IT 部門は、これらの重要なサービスやアプリケーションのパフォーマンスと可用性を保証する役割を担っています。 そのためには、アプリケーションのユーザー側で問題が発生する前に、問題の発生時刻、発生箇所、発生原因を突き止めるのが理想ですが、 コンピューターやデバイスの数が増えれば増えるほど、それは難しくなります。
このような環境で Operations Manager を使用すれば、複数のコンピューター、デバイス、サービス、およびアプリケーションの監視が容易になります。 下の図に示すオペレーション コンソールでは、業務環境内で監視しているオブジェクトのヘルス、パフォーマンス、可用性をチェックしながら、問題を特定し、解決することができます。
[!メモ]
Operations Manager の各種コンソールの使い方については、この操作ガイドの「Operations Manager コンソールの使用」を参照してください。
Operations Manager では、異常な監視対象オブジェクトを通知し、問題が特定された場合にはアラートを送信します。また、問題の原因や考えられる解決方法の特定に役立つ情報を提供します。 管理者は、監視するコンピューターとデバイスを選択し、特定の機能やアプリケーションの監視に使用する管理パックを事前にインポートして、監視条件を構成します。 監視対象オブジェクトおよび監視の目的を決定するには、Operations Manager インフラストラクチャを構成する各機能、および Operations Manager の動作の仕組みを理解しておく必要があります。
Operations Manager インフラストラクチャ
Operations Manager をインストールすると、1 つの管理グループが作成されます。 この管理グループが機能の基本単位です。 1 つの管理グループは、最低 1 台の管理サーバーと、そのオペレーション データベース、およびレポート作成用のデータ ウェアハウス データベースで構成されます。
管理サーバーは、管理グループの管理と、データベースとの通信の起点となります。 オペレーション コンソールを開いて管理グループに接続すると、その管理グループの管理サーバーに接続されます。 コンピューティング環境の規模に応じて、1 つの管理グループに 1 台の管理サーバーを含めることも、複数の管理サーバーを含めることもできます。
オペレーション データベースは、管理グループのすべての構成データを格納している SQL Server データベースで、管理グループによって収集、処理された監視データをすべて保存します。 オペレーション データベースに保持されるデータは、短期的な (既定では 7 日間の) データです。
データ ウェアハウス データベースは、監視データやアラート データを履歴目的で保存する SQL Server データベースです。 Operations Manager データベースに書き込まれたデータは、データ ウェアハウス データベースにも書き込まれるため、レポートには、常に現在の最新データが含まれています。 データ ウェアハウス データベースは、データを長期間保持します。
Operations Manager のレポート機能をインストールすると、管理グループにもレポート サーバーが追加されます。このサーバーは、データ ウェアハウス データベースからデータを取得してレポートを作成、表示する役目を担います。
次の図に示すように、管理グループのこれらのコア コンポーネントは、1 台のサーバー上に配置することも、複数のサーバーにわたって分散することもできます。
管理グループの各機能をインストールする方法については、『Operations Manager 2012 展開ガイド』を参照してください。
管理サーバー
管理サーバーの役割は、管理グループの構成の管理、エージェントの管理とエージェントとの通信、および管理グループ内のデータベースとの通信を行うことです。
機能を強化する場合や、問題発生時の中断を防ぐために、管理グループに複数の管理サーバーを含めることもできます。 1 つの管理グループに複数の管理サーバーを追加すると、それらの管理サーバーがリソース プールの一部として機能するようになり、プールの各メンバーに負荷が分散されます。 リソース プールのメンバーの 1 つで障害が発生した場合、そのリソース プール内の他のメンバーが、そのメンバーのワークロードを引き継ぎます。 リソース プールに新しい管理サーバーを追加すると、その管理サーバーは、自動的にリソース プール内の既存のメンバーから一部の処理を引き継ぎます。 リソース プール内のすべてのメンバーは、異なるリモート オブジェクトのセットを管理します。つまり、任意の時点で同じプール内の 2 つのメンバーが、同じオブジェクトを同時に管理することはありません。
特殊な種類の管理サーバーの 1 つに、ゲートウェイ サーバーがあります。 ゲートウェイ サーバーを使うと、信頼されていないドメイン内のコンピューターを監視できます。 詳細については、「Monitoring Across Untrusted Boundaries (信頼されていない境界の監視)」を参照してください。
エージェント
Operations Manager エージェントは、コンピューターにインストールされるサービスの 1 つです。 エージェントは、データの収集、サンプル データと定義済み値の比較、アラートの生成、応答の実行を行います。 管理サーバーは、構成を受信して、その構成を監視対象コンピューター上のエージェントに配信します。
すべてのエージェントは、管理グループ内の管理サーバーに報告を行います。 この管理サーバーを、そのエージェントのプライマリ管理サーバーと呼びます。
エージェントは、監視対象コンピューター上のデータ ソースを監視し、管理サーバーから送信された構成に従って情報を収集します。 エージェントは、監視対象コンピューターとそのコンピューター上のオブジェクトのヘルス状態も計算し、管理サーバーに報告します。 監視対象オブジェクトのヘルス状態が変化したり、他の条件に一致した状態になると、エージェントでアラートが生成されます。 これにより、オペレーターは何か異常が発生したことを察知できます。 エージェントから管理サーバーに送信される監視対象オブジェクトのヘルス データをチェックすることで、そのオブジェクトがホストしているすべてのアプリケーションのヘルスに関する最新の状況を把握できます。
1 つのエージェントをプロキシ エージェントとして機能するように構成することもできます。 プロキシ エージェントは、エージェントのホスト コンピューター以外のコンピューターまたはネットワーク デバイスに関するデータを管理サーバーに送信できるエージェントです。 たとえば、SQL クラスターの物理ノードにインストールされているエージェントを、クラスター リソースを監視するためのプロキシとして使用できます。 プロキシ エージェントを使うことで、エージェントをインストールできないコンピューターやデバイスも監視できるようになります。 詳細については、「エージェントレス監視」を参照してください。
サービス
監視対象コンピューター上で、Operations Manager エージェントは、System Center Management ヘルス サービスとして表示されます。 System Center Management ヘルス サービスでは、パフォーマンス データの収集、タスクの実行などを行います。 このサービスは、報告先の管理サーバーと通信できなくなった場合でも稼働を続け、収集したデータやイベントを監視対象コンピューターのディスクに待機させておき、 接続が復旧し次第、それらのデータやイベントを管理サーバーに送信します。
[!メモ]
System Center Management ヘルス サービスは、「ヘルス サービス」と呼ばれることがあります。
System Center Management ヘルス サービスは、管理サーバー上でも実行されます。 管理サーバー上で、System Center Management ヘルス サービスは、監視ワークフローを実行し、資格情報を管理します。 ワークフローを実行するために、System Center Management ヘルス サービスでは、指定された資格情報を使用して MonitoringHost.exe プロセスを開始します。 これらのプロセスでは、イベント ログ データ、パフォーマンス カウンター データ、Windows Management Instrumentation (WMI) データを監視および収集し、スクリプトなどのアクションを実行します。
管理サーバーでは、System Center データ アクセス サービスと System Center 管理構成サービスも実行します。
System Center データ アクセス サービスでは、オペレーション コンソールにオペレーション データベースへのアクセスを提供し、データベースにデータを書き込みます。
System Center 管理構成サービスでは、管理グループのリレーションシップとトポロジを管理します。 また、監視対象オブジェクトに管理パックを配布します。
管理パック
System Center Management サービスが実行するワークフローは、管理パックによって決まります。 管理パックには、エージェントが特定のアプリケーションやテクノロジのどの情報を収集して管理サーバーに報告するかが定義されています。 たとえば、BizTalk Server の管理パックには、BizTalk Server アプリケーションの正常性 (ヘルス) と効率性を保証するために重要なイベントと操作を収集して評価するルールおよびモニターが含まれています。
Operations Manager は、エージェントをコンピューターにインストールすると、初期構成をエージェントに送信します。 この初期構成には、管理パックからのオブジェクト検出が含まれています。 管理パックでは、Operations Manager によって検出されたコンピューター上で監視の対象となるオブジェクトの種類 (アプリケーションや機能など) を定義します。 エージェントは、コンピューターで検出されたオブジェクトのインスタンスを特定するデータを管理サーバーに送信します。 次に管理サーバーは、コンピューターごとに検出されたオブジェクトに適用される管理パックの要素 (ルールやモニターなど) をエージェントに送信します。
ルールは、コンピューターから収集するイベントとパフォーマンス データ、および収集したそれらの情報の処理方法を定義したものです。 ルールとは、単純に考えれば、If/Then ステートメントのようなものです。 たとえば、アプリケーションの管理パックには次のようなルールが含まれる場合があります。
アプリケーションをシャットダウンしているというメッセージがイベント ログに表示された場合に、アラートを作成する。
ソース ファイルのアップロードが失敗した場合に、そのエラーを示すイベントを収集する。
これらの例からわかるとおり、ルールを使うと、エージェントが管理サーバーに送信するアラートを作成し、イベントやパフォーマンス データを収集できます。 また、エラーが発生したアプリケーションをルールで再起動するなどのスクリプトを実行することもできます。
検出されたオブジェクトのヘルス状態は、緑 (成功または正常)、黄 (警告)、または赤 (重大または異常) でオペレーション コンソールに反映されます。モニターには、監視対象オブジェクトの特定の側面のヘルス状態が定義されています。 たとえば、ディスク ドライブの容量のモニターで、使用済み容量が 85% 未満の場合は緑、85% 以上の場合は黄、90% 以上の場合は赤と定義する場合があります。 状態が変わったときにアラートを発生するようにモニターを構成することもできます。
オブジェクトの検出と監視のしくみ
次の図は、オブジェクトの検出、監視プロセスを示したものです。
管理者は、管理するコンピューターを検索するように Operations Manager を構成します。 コンピューターの検出に関する詳細については、「検出とエージェントの管理」を参照してください。
指定した条件に一致するコンピューターと、まだ管理されていないコンピューターが特定されます。
検出されたコンピューターに Operations Manager エージェントがインストールされます。
エージェントが構成データを要求すると、管理サーバーは、インストールされた管理パックから、検出されるクラスが含まれている構成データをエージェントに送信します。 たとえば、Windows Server オペレーティング システム管理パックがインストールされている場合、管理サーバーはオペレーティング システムのクラスをエージェントに送信します。
エージェントは、構成データをコンピューターと照合して、検出するオブジェクトを特定し、その情報を管理サーバーに返します。 たとえば、エージェントは、Windows Server 2008 R2 オペレーティング システムのインスタンスがそのコンピューター上に存在するという情報を管理サーバーに返します。
管理サーバーは、インストールされた管理パックから、検出するオブジェクトに適用するすべての監視ロジックを取得して、エージェントに送信します。 たとえば、Windows Server 2008 R2 に適用される監視ロジックのすべてがエージェントで受信されます。
エージェントは、ルールやモニターなどの監視ロジックを適用して、ワークフローを実行し、データを監視サーバーに返します。
アプリケーションが追加、アンインストールされるなど、検出されたオブジェクトに変更が発生すると、エージェントはその更新情報を管理サーバーに送信し、管理サーバーはそれを基に監視ロジックを更新して、エージェントに送信します。
[!メモ]
Operations Manager では、ネットワーク デバイス、UNIX および Linux のオペレーティング システムを実行しているコンピューターも検出および監視でき、またエージェントレス監視も提供できます。 詳細については、『操作ガイド』の「Operations Manager Monitoring Scenarios (Operations Manager の監視環境)」を参照してください。
エージェントと管理サーバー間のデータのやり取り
Operations Manager エージェントでは、アラートと検出データをプライマリ管理サーバーに送信し、プライマリ管理サーバーでは、そのデータをオペレーション データベースに書き込みます。 また、エージェントのイベント、パフォーマンス、状態に関するデータもエージェントからプライマリ管理サーバーに送信され、プライマリ管理サーバーがそれらのデータをオペレーション データベースとデータ ウェアハウス データベースに同時に書き込みます。
エージェントは、各ルールとモニターのスケジュール パラメーターに従ってデータを送信します。 最適化された収集ルールでは、カウンターのサンプルと前のサンプルとの差が、指定された許容範囲 (10% など) に達した場合にのみ、データが転送されます。 これにより、ネットワーク トラフィック、およびオペレーション データベースに保存されるデータの量を削減できます。
また、すべてのエージェントは、ハートビートと呼ばれるデータのパケットを管理サーバーに送信します。既定では、60 秒置きに送信します。 このハートビートは、エージェントの可用性、およびエージェントと管理サーバー間の通信をチェックするためのものです。 ハートビートの詳細については、「Operations Manager のハートビートのしくみ」を参照してください。
Operations Manager は、リモート ヘルス サービスの状態を監視サーバーの視点から監視するヘルス サービス ウォッチャーをエージェントごとに実行します。
Operations Manager のその他の資料
Operations Manager のインストール方法と管理グループの展開方法については、『Operations Manager for System Center 2012 展開ガイド』を参照してください。
管理グループのセットアップ後に Operations Manager を使用する方法については、『Operations Manager for System Center 2012 操作ガイド』を参照してください。
管理パックの作成方法については、『Operations Manager for System Center 2012 作成ガイド』を参照してください。