Azure Service Fabric での監視と診断のベストプラクティス

[アーティクル]
06/01/2023

監視と診断は、あらゆるクラウド環境でアプリケーションやサービスを開発、テスト、およびデプロイするために非常に重要です。たとえば、アプリケーションの使われ方、Service Fabric プラットフォームによって実行されたアクション、パフォーマンスカウンターでのリソースの使用状況、クラスターの全体的な正常性を追跡できます。この情報を使って、問題の診断と修正を行い、再発を防ぐことができます。

アプリケーションの監視

アプリケーションの監視は、アプリケーションの機能やコンポーネントがどのように使用されているかを追跡します。アプリケーションを監視して、ユーザーに影響が及ぶ問題を把握します。ビジネスロジックはアプリケーションごとに固有なので、アプリケーションの監視は、アプリケーションとそのサービスを開発するユーザーに責任があります。 Azure のアプリケーション監視ツールである Application Insights を使用して、アプリケーションの監視を設定することをお勧めします。

クラスターの監視

Service Fabric の目標の 1 つは、ハードウェア障害に対する回復性をアプリケーションに持たせることです。この目標を実現するには、プラットフォームのシステムサービスの機能を利用します。この機能は、インフラストラクチャの問題を特定し、ワークロードをクラスター内の別のノードにすばやくフェールオーバーします。ただし、システムサービス自体に問題がある場合はどうなるでしょうか。または、ワークロードのデプロイまたは移動でサービス配置のルールに違反したらどうなるでしょうか。 Service Fabric には、このような問題や他の問題に対応する診断機能があるため、Service Fabric プラットフォームがアプリケーション、サービス、コンテナー、およびノードとどのようにやり取りしているかについて確実に把握することができます。

Windows クラスターの場合は、診断エージェントと Azure Monitor ログを使用してクラスターの監視を設定することをお勧めします。

Linux クラスターの場合、Azure Monitor ログは Azure プラットフォームとインフラストラクチャの監視にも推奨されるツールです。 Linux プラットフォームの診断には、「Syslog 内の Service Fabric Linux クラスターイベント」で説明されているように異なる構成が必要です。

インフラストラクチャ監視

クラスターレベルのイベントを監視するには、Azure Monitor ログが推奨されます。前のリンクで説明されているように、ワークスペースを使用して Log Analytics エージェントを構成すると、パフォーマンスメトリック (CPU 使用率など)、.NET パフォーマンスカウンター (プロセスレベルの CPU 使用率など)、Service Fabric パフォーマンスカウンター (信頼できるサービスからの例外数など)、コンテナーメトリック (CPU 使用率など) を収集できるようになります。 Azure Monitor ログで利用するには、コンテナーログを stdout または stderr に書き込む必要があります。

ウォッチドッグ

一般的に、ウォッチドッグとは、複数のサービスにわたって正常性と負荷を監視し、エンドポイントに ping を送信し、クラスター内の予期しない正常性イベントを報告する個別のサービスを指します。これは、1 つのサービスのパフォーマンスのみに基づくと検出されない可能性があるエラーを防ぐために役立ちます。またウォッチドッグは、ユーザー操作を必要としない修復アクションを実行するコードをホストする場所としても適しています。たとえば、特定の時間間隔でのストレージ内のログファイルクリーンアップなどです。使いやすいウォッチドッグ拡張モデルを含み、Windows と Linux の両方のクラスターで動作する、完全に実装されたオープンソースの SF ウォッチドッグサービスが必要な場合は、FabricObserver プロジェクトを参照してください。 FabricObserver は、実稼働可能なソフトウェアです。テストおよび運用クラスターに FabricObserver をデプロイし、そのプラグインモデルを使用してニーズに合わせて拡張するか、またはフォークして独自の組み込みのオブザーバーを作成することをお勧めします。前者 (プラグイン) が推奨される方法です。

次のステップ

アプリケーションのインストルメント化の概要については、アプリケーションレベルのイベントとログの生成に関するページを参照してください。
アプリケーションの Application Insights を設定する手順をについては、「Service Fabric での ASP.NET Core アプリケーションの監視と診断」をご覧ください。
Service Fabric が提供するプラットフォームおよびイベント監視の詳細については、プラットフォームレベルのイベントとログの生成に関するページを参照してください。
Service Fabric との Azure Monitor ログを構成する: クラスターに Azure Monitor ログを設定する
コンテナーの監視用に Azure Monitor ログを設定する方法については、「Azure Service Fabric での Windows コンテナーの監視と診断」を参照してください。
Service Fabric での診断の問題と解決策の例については、一般的なシナリオの診断に関する記事を参照してください。
Azure リソースの一般的な監視の推奨事項については、「ベストプラクティス - 監視と診断」を参照してください。

次の方法で共有

Azure Service Fabric での監視と診断のベストプラクティス

アプリケーションの監視

クラスターの監視

インフラストラクチャ監視

ウォッチドッグ

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Azure Service Fabric での監視と診断のベスト プラクティス

アプリケーションの監視

クラスターの監視

インフラストラクチャ監視

ウォッチドッグ

次のステップ

フィードバック

フィードバック

その他のリソース

Azure Service Fabric での監視と診断のベストプラクティス