Azure Service Fabric アプリケーションの設計に関するベスト プラクティス

この記事では、Azure Service Fabric でのアプリケーションとサービスの構築に関するベスト プラクティス ガイダンスを提供します。

Service Fabric の理解を深める

アプリケーションの設計ガイダンス

Service Fabric アプリケーションの全般的なアーキテクチャと、それらの設計に関する考慮事項について理解を深めます。

API ゲートウェイを選択する

スケール アウト可能な、バックエンド サービスと通信する API ゲートウェイ サービスを使用します。使用される最も一般的な API ゲートウェイ サービスは次のとおりです。

ステートレス サービス

常に、Reliable Services を使用し、Azure データベース、Azure Cosmos DB、または Azure Storage に状態を格納することで、ステートレス サービスの構築を開始することをお勧めします。 状態の外部化は、ほとんどの開発者にとってより使い慣れた方法です。 このアプローチでは、ストアでクエリ機能の利点を活用することもできます。

ステートフル サービスを使用する場合

低待機時間のシナリオで、データをコンピューティングの近くに維持する必要がある場合は、ステートフル サービスを検討してください。 いくつかのシナリオ例として、IoT デジタル ツイン デバイス、ゲームの状態、セッションの状態、データベースからのデータのキャッシュおよび他のサービスの呼び出しを追跡するための長期ワークロードがあります。

データ保持の期間を決定する:

  • キャッシュ データ。 外部ストアに対する待機時間が問題である場合は、キャッシュを使用します。 独自のデータ キャッシュとしてステートフル サービスを使用するか、オープンソースの SoCreate Service Fabric Distributed Cache の使用を検討してください。 このシナリオでは、キャッシュ内のすべてのデータが失われる可能性がありますが、問題ありません。
  • 期限付きのデータ。 このシナリオでは、待機時間のために一定の期間、コンピューティングの近くにデータを保持する必要がありますが、"障害" によってデータが失われても差し支えありません。 たとえば、多くの IoT ソリューションでは、過去数日間の平均温度を計算する場合など、データをコンピューティングに近づける必要があります。しかし、このデータが失われた場合、記録された特定のデータ ポイントはそれほど重要ではありません。 また、このシナリオでは、通常、個々のデータ ポイントのバックアップは考慮しません。 外部ストレージに定期的に書き込まれる、計算された平均値のみをバックアップします。
  • 長期的なデータ。 リライアブル コレクションではデータを永続的に格納できます。 しかし、この場合、クラスターの定期的なバックアップ ポリシーの構成を含む、ディザスター リカバリーの準備が必要となります。 実際には、障害によってクラスターが破棄された場合の動作、新しいクラスターを作成する必要がある場所、および新しいアプリケーション インスタンスをデプロイし、最新のバックアップから復元する方法を構成します。

コストを削減し、可用性を向上させる:

  • リモート ストアからのデータ アクセスおよびトランザクション コストは発生せず、Azure Cache for Redis などの別のサービスを使用する必要がないため、ステートフル サービスの使用によってコストを削減することができます。
  • ステートフル サービスは、コンピューティングではなく、主にストレージのために使用する場合、コストがかかるため、お勧めできません。 ローカル ストレージのコストが低いコンピューティングとして、ステートフル サービスを検討してください。
  • 他のサービスへの依存関係を取り除くことで、サービスの可用性を向上させることができます。 クラスター内の HA で状態を管理することで、他のサービスのダウンタイムや待機時間の問題から切り離すことができます。

Reliable Services を操作する方法

Service Fabric Reliable Services では、ステートレス サービスとステートフル サービスを簡単に作成できます。 詳細については、「Reliable Services の概要」を参照してください。

  • ステートレス サービスとステートフル サービスの RunAsync() メソッドと、ステートフル サービスの ChangeRole()メソッドでは、常にキャンセル トークンを優先します。 そうしないと、Service Fabric では、サービスを閉じることができるかどうかが認識されません。 たとえば、キャンセル トークンを優先しない場合、アプリケーションのアップグレード時間がかなり長くなる可能性があります。
  • 適時に通信リスナーを開いたり閉じたりして、キャンセル トークンを優先します。
  • 同期コードと非同期コードを混在させないでください。 たとえば、非同期呼び出しで .GetAwaiter().GetResult() を使用しないでください。 コール スタックでは "最初から最後まで" 非同期を使用します。

Reliable Actors を操作する方法

Service Fabric Reliable Actors では、ステートフルな仮想アクターを簡単に作成できます。 詳細については、Reliable Actors の概要に関する記事を参照してください。

  • アプリケーションのスケーリングのために、アクター間でのパブリッシュ/サブスクライブ メッセージングの使用を真剣に検討してください。 このサービスを提供するツールには、オープンソースの SoCreate Service Fabric Pub/SubAzure Service Bus などがあります。
  • アクターの状態をできるだけ詳細に定めます。
  • アクターのライフ サイクルを管理します。 アクターを再び使用することがない場合は削除します。 揮発状態プロバイダーを使用している場合は、すべての状態がメモリに格納されるため、不要なアクターを削除することが特に重要です。
  • ターンベースのコンカレンシーにより、アクターを独立したオブジェクトとして使用するのが最適です。 複数アクターの同期メソッド呼び出し (それぞれが別のネットワーク呼び出しになる可能性が最も高い) のグラフを作成したり、循環アクター要求を作成したりしないでください。 これらは、パフォーマンスとスケールに大きく影響します。
  • 同期コードと非同期コードを混在させないでください。 パフォーマンスの問題を防ぐために、常に非同期を使用します。
  • アクターで長期呼び出しを行わないでください。 長期呼び出しを行うと、ターンベースのコンカレンシーにより、同じアクターへの他の呼び出しがブロックされます。
  • Service Fabric リモート処理を使用して他のサービスと通信しており、ServiceProxyFactory を作成する場合は、アクター レベルではなくアクター サービス レベルでファクトリーを作成します。

アプリケーション診断

サービス呼び出しでのアプリケーションのログ記録の追加を徹底してください。 これは、サービスが相互に呼び出されるシナリオの診断に役立ちます。 たとえば、A から B、B から C、C から D という呼び出しの場合、呼び出しはどの場所でも失敗する可能性があります。 ログ記録が十分でない場合、エラーの診断は困難です。 呼び出しのボリュームにより、サービスのログ記録が多すぎる場合は、少なくともエラーと警告のログを記録するようにしてください。

Azure での設計ガイダンス