Azure Service Fabric アプリケーションの設計に関するベストプラクティス

[アーティクル]
06/01/2023

この記事では、Azure Service Fabric でのアプリケーションとサービスの構築に関するベストプラクティスガイダンスを提供します。

Service Fabric の理解を深める

Service Fabric の詳細に関する記事を読む。
Service Fabric アプリケーションのシナリオについて確認する。
「Service Fabric プログラミングモデルの概要」を読んでプログラミングモデルの選択肢について理解する。

アプリケーションの設計ガイダンス

Service Fabric アプリケーションの全般的なアーキテクチャと、それらの設計に関する考慮事項について理解を深めます。

API ゲートウェイを選択する

スケールアウト可能な、バックエンドサービスと通信する API ゲートウェイサービスを使用します。使用される最も一般的な API ゲートウェイサービスは次のとおりです。

Azure API Management。Service Fabric と統合されます。
Træfik リバースプロキシ。Azure Service Fabric プロバイダーを使用します。
Azure Application Gateway。

Note

Azure Application Gateway は、Service Fabric と直接統合されません。 Azure API Management は、一般に推奨される選択肢です。
独自のカスタムビルド ASP.NET Core Web アプリケーションゲートウェイ。

ステートレスサービス

常に、Reliable Services を使用し、Azure データベース、Azure Cosmos DB、または Azure Storage に状態を格納することで、ステートレスサービスの構築を開始することをお勧めします。状態の外部化は、ほとんどの開発者にとってより使い慣れた方法です。このアプローチでは、ストアでクエリ機能の利点を活用することもできます。

ステートフルサービスを使用する場合

低待機時間のシナリオで、データをコンピューティングの近くに維持する必要がある場合は、ステートフルサービスを検討してください。いくつかのシナリオ例として、IoT デジタルツインデバイス、ゲームの状態、セッションの状態、データベースからのデータのキャッシュおよび他のサービスの呼び出しを追跡するための長期ワークロードがあります。

データ保持の期間を決定する:

キャッシュデータ。外部ストアに対する待機時間が問題である場合は、キャッシュを使用します。独自のデータキャッシュとしてステートフルサービスを使用するか、オープンソースの SoCreate Service Fabric Distributed Cache の使用を検討してください。このシナリオでは、キャッシュ内のすべてのデータが失われる可能性がありますが、問題ありません。
期限付きのデータ。このシナリオでは、待機時間のために一定の期間、コンピューティングの近くにデータを保持する必要がありますが、"障害" によってデータが失われても差し支えありません。たとえば、多くの IoT ソリューションでは、過去数日間の平均温度を計算する場合など、データをコンピューティングに近づける必要があります。しかし、このデータが失われた場合、記録された特定のデータポイントはそれほど重要ではありません。また、このシナリオでは、通常、個々のデータポイントのバックアップは考慮しません。外部ストレージに定期的に書き込まれる、計算された平均値のみをバックアップします。
長期的なデータ。リライアブルコレクションではデータを永続的に格納できます。しかし、この場合、クラスターの定期的なバックアップポリシーの構成を含む、ディザスターリカバリーの準備が必要となります。実際には、障害によってクラスターが破棄された場合の動作、新しいクラスターを作成する必要がある場所、および新しいアプリケーションインスタンスをデプロイし、最新のバックアップから復元する方法を構成します。

コストを削減し、可用性を向上させる:

リモートストアからのデータアクセスおよびトランザクションコストは発生せず、Azure Cache for Redis などの別のサービスを使用する必要がないため、ステートフルサービスの使用によってコストを削減することができます。
ステートフルサービスは、コンピューティングではなく、主にストレージのために使用する場合、コストがかかるため、お勧めできません。ローカルストレージのコストが低いコンピューティングとして、ステートフルサービスを検討してください。
他のサービスへの依存関係を取り除くことで、サービスの可用性を向上させることができます。クラスター内の HA で状態を管理することで、他のサービスのダウンタイムや待機時間の問題から切り離すことができます。

Reliable Services を操作する方法

Service Fabric Reliable Services では、ステートレスサービスとステートフルサービスを簡単に作成できます。詳細については、「Reliable Services の概要」を参照してください。

ステートレスサービスとステートフルサービスの RunAsync() メソッドと、ステートフルサービスの ChangeRole()メソッドでは、常にキャンセルトークンを優先します。そうしないと、Service Fabric では、サービスを閉じることができるかどうかが認識されません。たとえば、キャンセルトークンを優先しない場合、アプリケーションのアップグレード時間がかなり長くなる可能性があります。
適時に通信リスナーを開いたり閉じたりして、キャンセルトークンを優先します。
同期コードと非同期コードを混在させないでください。たとえば、非同期呼び出しで .GetAwaiter().GetResult() を使用しないでください。コールスタックでは "最初から最後まで" 非同期を使用します。

Reliable Actors を操作する方法

Service Fabric Reliable Actors では、ステートフルな仮想アクターを簡単に作成できます。詳細については、Reliable Actors の概要に関する記事を参照してください。

アプリケーションのスケーリングのために、アクター間でのパブリッシュ/サブスクライブメッセージングの使用を真剣に検討してください。このサービスを提供するツールには、オープンソースの SoCreate Service Fabric Pub/Sub や Azure Service Bus などがあります。
アクターの状態をできるだけ詳細に定めます。
アクターのライフサイクルを管理します。アクターを再び使用することがない場合は削除します。揮発状態プロバイダーを使用している場合は、すべての状態がメモリに格納されるため、不要なアクターを削除することが特に重要です。
ターンベースのコンカレンシーにより、アクターを独立したオブジェクトとして使用するのが最適です。複数アクターの同期メソッド呼び出し (それぞれが別のネットワーク呼び出しになる可能性が最も高い) のグラフを作成したり、循環アクター要求を作成したりしないでください。これらは、パフォーマンスとスケールに大きく影響します。
同期コードと非同期コードを混在させないでください。パフォーマンスの問題を防ぐために、常に非同期を使用します。
アクターで長期呼び出しを行わないでください。長期呼び出しを行うと、ターンベースのコンカレンシーにより、同じアクターへの他の呼び出しがブロックされます。
Service Fabric リモート処理を使用して他のサービスと通信しており、ServiceProxyFactory を作成する場合は、アクターレベルではなく、アクターサービスレベルでファクトリーを作成します。

アプリケーション診断

サービス呼び出しでのアプリケーションのログ記録の追加を徹底してください。これは、サービスが相互に呼び出されるシナリオの診断に役立ちます。たとえば、A から B、B から C、C から D という呼び出しの場合、呼び出しはどの場所でも失敗する可能性があります。ログ記録が十分でない場合、エラーの診断は困難です。呼び出しのボリュームにより、サービスのログ記録が多すぎる場合は、少なくともエラーと警告のログを記録するようにしてください。

Azure での設計ガイダンス

Azure でのマイクロサービスの構築に関する設計ガイダンスについては、Azure アーキテクチャセンターにアクセスしてください。
ゲームサービスでの Service Fabric の使用に関する設計ガイダンスについては、「ゲームで Azure を使ってみる」を参照してください。

Azure Service Fabric アプリケーションの設計に関するベスト プラクティス